
[NetsPresso] AI Inference Optimization Engineer
요약
- 마감일
- 2026.08.11D-67
- 직무
- 소프트웨어 개발, 소프트웨어아키텍트
- 경력
- 2년 이상
- 고용형태
- 정규직
- 근무지역
- 서울
- 스킬
- AI, 커널, gpu, NPU, ONNX, AI 모델 최적화, Execu Torch, Heterogeneous Computing
기업 이미지
기업 소개
AI for everyone, everywhere
AI를 누구에게나, 어디에서나
노타는 AI 최적화 기술을 통해 AI의 일상화를 선도하는 기업입니다.
우리는 다양한 디바이스와 산업 전반에 걸쳐, 누구나 어디서나 AI를 사용할 수 있는 세상을 만들고자 합니다.
노타의 핵심 제품인 넷츠프레소(NetsPresso)는 하드웨어의 특성을 이해하는 AI 모델 최적화 플랫폼입니다. 또한, 차세대 영상 관제 솔루션 (NVA: Nota Vision Agent), 지능형 교통 시스템(ITS) 등 온디바이스 생성형 AI 솔루션을 통해 실제 산업 현장에서의 AI 실현 가능성을 넓히고 있습니다.
국내 스타트업으로는 최초로 삼성과 LG의 투자 유치 기록을 보유하고 있으며, 네이버 DS2F의 첫 투자 기업이기도 합니다. 최근에는 두바이 교통국과의 AI 솔루션 공급 계약을 체결하고, CB Insights AI 100에도 선정되는 등 글로벌 무대에서의 성과를 이어가고 있습니다.
노타는 빠르게 성장하는 조직과 함께할 다양한 직군의 노타 크루를 찾고 있습니다. 직급과 경력에 관계없이 누구나 동등한 입장에서 의견을 나눌 수 있는 수평적인 문화 속에서, 공동의 목표를 향해 자율적으로 일할 수 있는 분과 함께하고 싶습니다.
누구나, 어디에서나 AI의 가치를 경험할 수 있도록 하는 여정, 지금 노타에서 함께하세요.
👋 우리 팀을 소개합니다.
NetsPresso Platform 팀은 Nota AI의 AI 모델 경량화 및 최적화 기술을 연구하며, 개발된 기술을 실제 제품으로 설계하고 구현하여 사용자에게 제공하는 조직입니다. 우리 팀은 Model Representation, Quantization, Graph Optimization, Model Engineering, SW Engineering 파트로 구성되어 있으며, 그 중 Graph Optimization 파트는 AI 모델을 실제 하드웨어 환경에서 더 효율적으로 실행하기 위한 방법을 연구합니다.
최적화 대상 모델과 하드웨어를 분석하여 최적화 기회를 발굴해내고, 실험을 통해 실제로 적용 가능한 새로운 최적화 기법을 찾아내는 것이 우리의 일입니다. AI 모델과 AI 구동 하드웨어에 대한 이론과 실제를 모두 다루게 되며, 또한 그 과정에서 AI 개발 도구도 적극적으로 사용하게 됩니다. 함께 모험을 떠나실 분을 모집합니다!
📌 해당 포지션으로 합류하신다면
AI 모델이 실제 하드웨어에서 동작하기까지의 전 과정, 즉 Graph-level 변환부터 타겟 백엔드와 런타임으로의 Lowering, 그리고 하드웨어에서의 실제 추론 결과까지를 하나의 흐름으로 다루는 경험을 하게 됩니다.
단순히 주어진 최적화 문제를 구현하는 것에 그치지 않고, 특정 모델과 하드웨어 조합에서 왜 성능이 나오지 않는지를 직접 분석하고, 새로운 최적화 기회를 스스로 정의하는 과정에 참여합니다.
다양한 최적화 기법이 포함된 코드베이스와 AI 에이전트 기반 자동화 워크플로우가 갖춰진 환경에서, 구현-검증-실험의 사이클을 빠르게 반복하며 실질적인 성과를 만들어낼 수 있습니다. AI 도구를 단순한 보조 수단이 아니라 생산성의 핵심 무기로 활용하는 방식에 이미 익숙한 분이라면, 이 환경에서 빠르게 성장할 수 있습니다.
💡이런 분과 함께 하고 싶습니다
• AI 모델이 특정 런타임이나 하드웨어에서 동작하지 않았을 때, 왜 안 되는지를 직접 파고들어본 경험이 있는 분
• 어떤 최적화 기법을 선택했을 때, 그 선택의 이유를 명확하게 설명할 수 있는 분
• AI 도구 사용을 숨기지 않고, 오히려 어떻게 활용했는지를 구체적으로 이야기할 수 있는 분
AI를 누구에게나, 어디에서나
노타는 AI 최적화 기술을 통해 AI의 일상화를 선도하는 기업입니다.
우리는 다양한 디바이스와 산업 전반에 걸쳐, 누구나 어디서나 AI를 사용할 수 있는 세상을 만들고자 합니다.
노타의 핵심 제품인 넷츠프레소(NetsPresso)는 하드웨어의 특성을 이해하는 AI 모델 최적화 플랫폼입니다. 또한, 차세대 영상 관제 솔루션 (NVA: Nota Vision Agent), 지능형 교통 시스템(ITS) 등 온디바이스 생성형 AI 솔루션을 통해 실제 산업 현장에서의 AI 실현 가능성을 넓히고 있습니다.
국내 스타트업으로는 최초로 삼성과 LG의 투자 유치 기록을 보유하고 있으며, 네이버 DS2F의 첫 투자 기업이기도 합니다. 최근에는 두바이 교통국과의 AI 솔루션 공급 계약을 체결하고, CB Insights AI 100에도 선정되는 등 글로벌 무대에서의 성과를 이어가고 있습니다.
노타는 빠르게 성장하는 조직과 함께할 다양한 직군의 노타 크루를 찾고 있습니다. 직급과 경력에 관계없이 누구나 동등한 입장에서 의견을 나눌 수 있는 수평적인 문화 속에서, 공동의 목표를 향해 자율적으로 일할 수 있는 분과 함께하고 싶습니다.
누구나, 어디에서나 AI의 가치를 경험할 수 있도록 하는 여정, 지금 노타에서 함께하세요.
👋 우리 팀을 소개합니다.
NetsPresso Platform 팀은 Nota AI의 AI 모델 경량화 및 최적화 기술을 연구하며, 개발된 기술을 실제 제품으로 설계하고 구현하여 사용자에게 제공하는 조직입니다. 우리 팀은 Model Representation, Quantization, Graph Optimization, Model Engineering, SW Engineering 파트로 구성되어 있으며, 그 중 Graph Optimization 파트는 AI 모델을 실제 하드웨어 환경에서 더 효율적으로 실행하기 위한 방법을 연구합니다.
최적화 대상 모델과 하드웨어를 분석하여 최적화 기회를 발굴해내고, 실험을 통해 실제로 적용 가능한 새로운 최적화 기법을 찾아내는 것이 우리의 일입니다. AI 모델과 AI 구동 하드웨어에 대한 이론과 실제를 모두 다루게 되며, 또한 그 과정에서 AI 개발 도구도 적극적으로 사용하게 됩니다. 함께 모험을 떠나실 분을 모집합니다!
📌 해당 포지션으로 합류하신다면
AI 모델이 실제 하드웨어에서 동작하기까지의 전 과정, 즉 Graph-level 변환부터 타겟 백엔드와 런타임으로의 Lowering, 그리고 하드웨어에서의 실제 추론 결과까지를 하나의 흐름으로 다루는 경험을 하게 됩니다.
단순히 주어진 최적화 문제를 구현하는 것에 그치지 않고, 특정 모델과 하드웨어 조합에서 왜 성능이 나오지 않는지를 직접 분석하고, 새로운 최적화 기회를 스스로 정의하는 과정에 참여합니다.
다양한 최적화 기법이 포함된 코드베이스와 AI 에이전트 기반 자동화 워크플로우가 갖춰진 환경에서, 구현-검증-실험의 사이클을 빠르게 반복하며 실질적인 성과를 만들어낼 수 있습니다. AI 도구를 단순한 보조 수단이 아니라 생산성의 핵심 무기로 활용하는 방식에 이미 익숙한 분이라면, 이 환경에서 빠르게 성장할 수 있습니다.
💡이런 분과 함께 하고 싶습니다
• AI 모델이 특정 런타임이나 하드웨어에서 동작하지 않았을 때, 왜 안 되는지를 직접 파고들어본 경험이 있는 분
• 어떤 최적화 기법을 선택했을 때, 그 선택의 이유를 명확하게 설명할 수 있는 분
• AI 도구 사용을 숨기지 않고, 오히려 어떻게 활용했는지를 구체적으로 이야기할 수 있는 분
주요 업무
• AI 모델과 타겟 하드웨어(NPU, GPU, CPU 등) 간의 불일치를 분석하고, 원인을 추적하여 해결
• Graph-level optimization pass 설계 및 구현 (op fusion, folding, decomposition, replacement 등)
• 모델 구조와 하드웨어 특성을 함께 고려한 최적화 기회 탐색 및 실험
• ExecuTorch, ONNX, PyTorch 등 다양한 프레임워크 기반 모델 변환 및 최적화
• AI 에이전트 기반 자동화 워크플로우 설계 및 활용
• Graph-level optimization pass 설계 및 구현 (op fusion, folding, decomposition, replacement 등)
• 모델 구조와 하드웨어 특성을 함께 고려한 최적화 기회 탐색 및 실험
• ExecuTorch, ONNX, PyTorch 등 다양한 프레임워크 기반 모델 변환 및 최적화
• AI 에이전트 기반 자동화 워크플로우 설계 및 활용
자격 요건
• 학부 졸업 이후 관련 분야 실무 경험 2년 이상 혹은 관련 분야 석사 학위 이상 취득
• PyTorch, ONNX, Python, Linux, Git 실무 경험
• AI 모델 학습과 실제 디바이스에의 실행 전 과정을 직접 따라가본 경험
• AI 모델 최적화, 경량화, 컴파일러, 커널 최적화 등 관련 분야 중 하나 이상에서 단순 라이브러리 사용을 넘어 원리 수준의 이해를 보유한 분
• 특정 기술적 선택을 한 이유를 명확하게 설명할 수 있는 분
• 해외 여행에 결격 사유가 없는 분
• PyTorch, ONNX, Python, Linux, Git 실무 경험
• AI 모델 학습과 실제 디바이스에의 실행 전 과정을 직접 따라가본 경험
• AI 모델 최적화, 경량화, 컴파일러, 커널 최적화 등 관련 분야 중 하나 이상에서 단순 라이브러리 사용을 넘어 원리 수준의 이해를 보유한 분
• 특정 기술적 선택을 한 이유를 명확하게 설명할 수 있는 분
• 해외 여행에 결격 사유가 없는 분
우대 사항
• Graph IR 수준의 모델 분석 및 변환 경험 (TensorRT, TFLite, ExecuTorch 등)
• NPU 또는 Custom Accelerator 타겟 모델 최적화 경험
• GPU, NPU 커널에 대한 깊은 이해
• Quantization, Pruning 등 경량화 기법에 대한 깊은 이해
• LLM, VLM, Diffusion 등 Generative AI 모델 구조에 대한 이해
• AI 에이전트 도구(Claude Code, Codex 등)를 업무 워크플로우에 실질적으로 통합한 경험
• 관련 논문 작성 또는 오픈소스 기여 경험
• NPU 또는 Custom Accelerator 타겟 모델 최적화 경험
• GPU, NPU 커널에 대한 깊은 이해
• Quantization, Pruning 등 경량화 기법에 대한 깊은 이해
• LLM, VLM, Diffusion 등 Generative AI 모델 구조에 대한 이해
• AI 에이전트 도구(Claude Code, Codex 등)를 업무 워크플로우에 실질적으로 통합한 경험
• 관련 논문 작성 또는 오픈소스 기여 경험
복리후생
🤓 팀의 메세지
모델을 돌려보는 것과, 모델이 왜 그렇게 동작하는지를 아는 것은 다릅니다. 저희는 후자에 관심 있는 사람과 일하고 싶습니다. 어떤 기술을 선택했을 때 그 이유를 설명할 수 있는 분, 막혔을 때 원인을 끝까지 추적해본 경험이 있는 분, 그리고 AI 도구를 자신의 생산성 무기로 이미 만들어두신 분이라면, 우리 팀에서 함께 의미 있는 일을 할 수 있을 것이라 생각합니다.
지원 전, 확인해주세요! 👀
•해당 공고는 상시 채용으로, 채용 완료 시 조기 마감될 수 있습니다.
•이력서 내 연봉 정보 등 민감한 개인 정보가 기재되어 있다면, 해당 서류는 검토되지 않을 수 있습니다.
•제출해 주신 내용 중 허위 사실이 있을 경우 채용이 취소될 수 있습니다.
•채용 전 레퍼런스 체크가 있음을 알려드립니다.
•최종 인터뷰 합격 시 별도로 처우를 협의합니다.
•입사 후 시용기간이 있으며, 이에 대한 처우는 차등을 두지 않음을 알려드립니다.
•국가보훈대상자 및 장애인은 관련 법규에 의거하여 우대합니다.
•장애인 고용 촉진을 위한 행정적 절차 확인이 필요한 경우, 장애인 등록증 사본을 기타 서류 란에 선택적으로 제출하실 수 있습니다. 제출 여부는 전형 평가에 어떠한 영향도 미치지 않습니다.
•R&D 모든 포지션에서 전문연구요원, 산업기능요원으로 근무가 가능합니다. (단, 산업기능요원 현역 신규 편입의 경우 불가능)
모델을 돌려보는 것과, 모델이 왜 그렇게 동작하는지를 아는 것은 다릅니다. 저희는 후자에 관심 있는 사람과 일하고 싶습니다. 어떤 기술을 선택했을 때 그 이유를 설명할 수 있는 분, 막혔을 때 원인을 끝까지 추적해본 경험이 있는 분, 그리고 AI 도구를 자신의 생산성 무기로 이미 만들어두신 분이라면, 우리 팀에서 함께 의미 있는 일을 할 수 있을 것이라 생각합니다.
지원 전, 확인해주세요! 👀
•해당 공고는 상시 채용으로, 채용 완료 시 조기 마감될 수 있습니다.
•이력서 내 연봉 정보 등 민감한 개인 정보가 기재되어 있다면, 해당 서류는 검토되지 않을 수 있습니다.
•제출해 주신 내용 중 허위 사실이 있을 경우 채용이 취소될 수 있습니다.
•채용 전 레퍼런스 체크가 있음을 알려드립니다.
•최종 인터뷰 합격 시 별도로 처우를 협의합니다.
•입사 후 시용기간이 있으며, 이에 대한 처우는 차등을 두지 않음을 알려드립니다.
•국가보훈대상자 및 장애인은 관련 법규에 의거하여 우대합니다.
•장애인 고용 촉진을 위한 행정적 절차 확인이 필요한 경우, 장애인 등록증 사본을 기타 서류 란에 선택적으로 제출하실 수 있습니다. 제출 여부는 전형 평가에 어떠한 영향도 미치지 않습니다.
•R&D 모든 포지션에서 전문연구요원, 산업기능요원으로 근무가 가능합니다. (단, 산업기능요원 현역 신규 편입의 경우 불가능)
채용 절차
•서류 검토 → 1차 인터뷰 → 온라인 과제 → 2차 인터뷰 → 3차 인터뷰 → 처우 협의 → 최종 선발
*프로세스는 상황에 따라 사전 안내 후 일부 변경될 수 있습니다.
*절차 간에 추가적인 과제가 있을 수 있습니다.
*프로세스는 상황에 따라 사전 안내 후 일부 변경될 수 있습니다.
*절차 간에 추가적인 과제가 있을 수 있습니다.
회사위치
서울특별시 강남구 테헤란로 521 파르나스 타워 16층 Nota
잡플래닛에서 지원하면?
당신의 합격을 위해 준비했어요
- 1차 합격 시면접가이드
- 취업축하금100만원
어디에서 신청하면 되나요?
