주요 업무 내용
[우리 조직을 소개합니다]
• 쏘카 데이터비즈니스본부는 모빌리티 산업의 핵심 비즈니스에 대해 머신러닝/통계/자동화/최적화/디바이스 등 다양한 도구를 활용하여 즉각적으로 개선하고 행동할 수 있는 문제들을 해결합니다.
• AI팀은 데이터비즈니스본부의 본부장 직속조직으로, 모빌리티 비즈니스에서 발생하는 여러 데이터를 잘 이해하는 AI를 연구/개발합니다.
• 참고하면 좋을 PR, 테크 블로그
• LLM으로 만들어가는 새로운 제품과 고객경험 : https://www.youtube.com/watch?v=_1mcVipuUYY&list=PLGh_JNxzXsX9NSm-iyAdS4Ioco0vp4jtq&index=7
• 쏘카 "실수 안 하는 'AI 상담원' 만들겠다" : https://zdnet.co.kr/view/?no=20231030151202
• 스타트업이 챗GPT로 사업하는 노하우 대방출 : https://zdnet.co.kr/view/?no=20231027080954
• ‘AI 퍼스트’ 쏘카, 연내 AI 고객센터 솔루션 도입 : https://www.fnnews.com/news/202305021549571929
• 쏘카 AI팀의 Applied Research Scientist는 어떤 일을 하나요? : https://tech.socarcorp.kr/data/2022/04/05/role-of-applied-research-scientist-at-socar.html
• 딥러닝 기반 세차 인증 자동화 모델 개발 이야기 : https://tech.socarcorp.kr/data/2022/04/18/develop-model-classifying-washed-car.html
• Semantic Segmentation을 활용한 차량 파손 탐지 딥러닝 모델 개발기 : https://tech.socarcorp.kr/data/2020/02/13/car-damage-segmentation-model.html
• Selected Workshop Publications
• Adapt and Prune Strategy for Multilingual Speech Foundational Model on Low-resourced Languages (EMNLP MRL Workshop, 2023)
• PMixUp: Simultaneous Utilization of Part-of-Speech Replacement and Feature Space Interpolation for Text Data Augmentation (ICLR PML4DC, 2023)
• Uncovering the Effectiveness of Calibration on Open Intent Classification (ICLR PML4DC, 2023)
• Lightweight Prompt Learning with General Representation for Rehearsal-free Continual Learning (NIPS Workshop on Meta-Learning, 2022)
[어떤 기술적 비전을 가지고 있나요.]
• AI를 기반으로 실제 비즈니스 임팩트(매출 증대, 비용 절감, 운영 효율성 증가)를 만드는 것을 목표합니다.
• LLM 영역에서는 상담사와 고객 사이의 음성 대화를 Text로 매핑해주는 Lightweight Speech-to-Text(STT), prompt engineering과 fine-tuned small LLM 기반의 AICC(AI기반 고객센터) 제품을 만들고 있습니다.
• Multi-Modality 영역에서는 차량 이미지, 블랙박스가 촬영한 주행 형상, 차량 센서 시계열 데이터 (i.e., IMU)와 텍스트를 이용해 Vision/Video/Sensor-Language Multi-Modality를 지향합니다
• 비즈니스 문제 정의 - 기술적 문제 정의 - AI모델 연구 및 개발 - 배포 및 자동화 - 비즈니스 임팩트 산출 - 프로세스 개선의 사이클을 통해 지속적으로 임팩트를 만들어 나갈 분을 기다리고 있습니다
• 시장에 존재하는 적절한 기술이 있다면, 이를 우선적으로 사용합니다. Novel한 것이 항상 최고가 아니고, SOTA가 항상 최선은 아니라고 믿습니다. 주어진 상황과 리소스, 비즈니스 환경을 종합적으로 고려했을 때의 투자 대비 임팩트가 중요하다고 믿습니다.
• LLM을 Fine-tuning하거나 pre-training하기 전에, 충분한 시간 동안 prompt engineering으로 문제를 풀어봅니다. prompt engineering으로 문제를 해결할 수 있다면, 굳이 자체 모델을 학습시키지 않습니다.
• 비즈니스에 맞닿지 않은 영역의 순수한 학문적 가치를 위한 연구는 지양합니다.
• AI와 맞닿아있는 End-User들의 피드백을 기반으로 지속적으로 성장하는 Human-Interactive AI Product을 지향합니다.
• AI를 이용하는 쏘카의 유저, 내부 사용자들의 목소리를 듣고 제품을 개선합니다.
• 항상 고객의 목소리를 듣고, 그들에게 가치를 줄 수 있는 제품을 지향합니다.
[어떤 일을 하나요.]
• 카셰어링 도메인에 존재하는 비즈니스 문제를 발굴하거나 이해하고, 이를 기술 문제로 정의합니다.
• 문제의 본질이 무엇인지 이해하고, 꼭 AI를 이용해서만 풀어야하는 것인지에 대해 충분히 조사하고 고민합니다.
• 풀고자 하는 문제에 대해 기술적인 의견을 제시하여, 비즈니스 의사결정을 내리는데 기여합니다.
• 문제를 해결할 수 있는 예비 솔루션들을 검토하고, 각각의 장단점 분석 및 비즈니스 임팩트 산정을 수행합니다.
• 비즈니스 임팩트의 적절성을 검토하고, Stakeholder와 논의하여 프로젝트 진행에 대한 의사결정을 내립니다.
• 팀원이 구축한 Evaluation Suite의 적절성을 검토하고, 비즈니스 목표와 기술 목표 달성에 기여할 수 있는지를 고민합니다.
• Prompt Engineering부터 학습까지, 적절한 방법을 선택해 제품에 들어갈 수 있는 모델을 개발합니다.
• 본부 내/외 다양한 팀들과 협업을 리드하고, 사전에 확보해두어야 할 리소스에 대해 커뮤니케이션하여 AI Product이 마일스톤에 맞게 Shipping될 수 있도록 조율합니다.
자격 요건
[이런 경험이 있으면 좋겠어요.]
• 유관 경력 5년 이상 혹은 그에 준하는 경험이 있는 분
• 기술 조직에서 Senior IC, 혹은 People/Engineering Manager 역할을 수행한 경험이 있는 분
• Production 환경에서 딥러닝 모델을 개발 - 배포- 운영한 경험이 있고, 최신 딥러닝 논문을 빠르게 이해하고 정확히 구현할 수 있는 분
• Production 환경에서 Prompt-based 제품을 개발 - 배포 - 운영한 경험이 있는 분
• 모빌리티 산업에 대한 높은 관심과 시장 잠재력에 대한 이해가 있으며, AI 관련 분야 전반, 머신러닝, 딥러닝 이론에 대한 전반적인 이해가 있는 분
※ 지원서 제출 시 Resume, 포트폴리오 or Cover Letter(각 프로젝트별 문제, 해결, 성과 항목 포함)를 반드시 함께 첨부바랍니다.
[이런 경험이 있으면 더욱 좋겠어요.]
• 5명 이상의 팀, 혹은 조직에서 피플 매니저 경험이 있는 분
• 클라우드 환경 기반 딥러닝/머신러닝 프로젝트 경험이 있는 분
• Real world 데이터를 이용한 딥러닝/머신러닝 프로젝트 경험, 낮은 신뢰도 혹은 불균형한 데이터 문제를 다뤄본 분
• 아래 분야에 연구 및 과제 경험이 있는 분
▷ Machine Learning
• Understanding Learned Representations in Deep Neural Networks
• Measuring Representation Similarity
• Interpretable Machine Learning
▷ Computer Vision
• Image Recognition and Object Detection under Highly Imbalanced, Weakly-Labeled, or Sparsely-Annotated Data
• Model Calibration, Uncertainty Estimation, Out-of-Distribution Detection, Few-Shot Learning
• Continual Learning
▷ Sequential Modeling
• Spatio-Temporal Modeling
• Anomaly Detection in Sequential Data
• Interpretability in Sequential Models
▷ Natural Language Processing
• Domain-specific Language Models, Prompt-Tuning
• Task-Oriented Dialogue System, Conversational AI
[자주 묻는 질문]
• Applied Research Scientist 포지션에서 가장 중요하게 보는 요소는 무엇인가요?
• 연구 실적 및 재직 경력 보다는, 특정 연구주제에 대해 끈질기고 집요하게 파고들었던 경험을 가장 중요하게 보고 있습니다.
• 예를 들어, 하나의 프로젝트 경험에 대해 “특정 데이터셋 A에서 98%의 Accuracy를 달성했다”라고 작성하시기보다는 아래의 내용이 포함하는 것을 추천드립니다
• 이 데이터셋에서 모델을 학습시킬 때는 ~한 문제가 있는데
• 그 문제는 왜 풀기 어려운 문제이고
• 그 어려운 문제를 ~한 방법으로 풀었고
• 내가 제안한 방법을 검증하기 위해 ~한 실험을 수행하여
• ~한 결과를 얻었다
• 향후 개선할 부분은 ~한 점들이 있다
[동료의 한마디]
• 요즘 동료들과 함께 “어떻게 AI가 인간처럼 사고하고 Reasoning하게 할 수 있을까?”라는 고민을 하고 있습니다. 카셰어링 도메인에 존재하는 문제는 물론이고, AI에 대한 원론적인 고민을 우수한 동료들과 함께 나누고, 토론하며 성장할 수 있는 환경이 큰 장점이라고 생각합니다.
• 자유로운 근무환경 속에서도, 개인과 팀의 목표 달성을 위해 노력하는 팀원들에게 강한 동기부여를 받을 수 있는 곳입니다. 하고자 하는 의지만 있다면 자신이 관심 있는 주제에 언제든 도전할 수 있고, 업무를 하며 생기는 부족한 점들은 팀원들과의 소통으로 함께 채워나갈 수 있는 환경이라고 생각합니다.
모빌리티 산업의 다양한 도메인에서 발생되는 데이터들을 다뤄볼 수 있어 여러 분야에 도전할 수 있는 팀입니다. 팀 전체가 문제 해결과 목표 달성을 향해 달려가며 성장하고, 연구 & 개발한 AI를 비즈니스에 적용하며 성취감을 느낄 수 있는 곳 입니다.
• 특정 도메인에서의 최신 논문 구현과 연구가 아닌, 실제 서비스에 적용 가능한 모델을 개발하기 위해 끊임없이 고민하고, 그 과정 속에서 발전할 수 있는 팀입니다. 팀 전체가 목표를 함께 설정하고, 목표를 이루기 위해 서로 고민과 지식을 나누며 성장할 수 있는 환경이 잘 갖춰져 있다고 생각합니다.
• 현실 세계의 데이터를 다루고 문제를 해결하는 일은 항상 어렵고 강한 집념이 요구 됩니다. 쏘카의 수평적이고 자유로운 조직 문화는 도전적인 문제를 해결하는데 있어 새로운 시각과 유연한 사고를 갖게 하는데 큰 도움이 됩니다.
• 비즈니스 문제를 AI가 풀 수 있는 문제로 정의하는 것부터 원론적인 Machine Learning까지, 개인의 관심 영역에 따라 다양한 프로젝트를 진행할 수 있는 곳입니다. 카셰어링 비즈니스에서만 풀 수 있는 Challenging한 문제들을 풀면서, 멋진 동료들과 생산성있는 Discussion 또한 경험해볼 수 있습니다.
[미래의 쏘팸이 되기 위한 과정]
• 서류 전형 → 전화 면접 → 1차(직무) 면접 → 2차(컬쳐 핏) 면접
• 후보자분들의 더 나은 이동을 위해 면접 시 쏘카 및 타다 쿠폰을 드립니다.