LLM Engineer (LLM Evaluation)

501-1000

South Korea

Location

Pangyo, South Korea

Salary

(Yearly)

(Hourly)

Undisclosed

We are looking for the best

About Us

42dot은 소프트웨어와 AI로 모빌리티 문제를 해결하기 위해 노력하는 모빌리티 AI 기업입니다. 현대자동차그룹 글로벌 소프트웨어 센터로서, 42dot은 소프트웨어 정의 차량 개발을 선도하며 미래 모빌리티를 개척하고 있습니다.

LLM Engineer (LLM Evaluation)는 대규모 언어 모델(LLM)의 성능을 신뢰성 있게 평가하고, 평가 결과를 기반으로 모델 품질을 지속적으로 개선할 수 있는 평가 체계와 플랫폼을 구축합니다.

빠르게 변화하는 LLM 환경 속에서 benchmark dataset, evaluation protocol, automation pipeline을 설계하여 모델의 품질과 안정성을 지속적으로 향상시키고, 실서비스 수준의 검증 체계를 운영하는 데 기여합니다.

또한 Kubernetes 기반 환경에서 Argo Workflows 및 MLflow를 활용하여 모델 평가–실험 관리–배포 검증까지 이어지는 end-to-end evaluation workflow를 구축하고, 반복 가능하고 재현성 있는 평가 환경을 고도화합니다.

Responsibilities

LLM Evaluation & Benchmark 설계
- LLM 성능 평가를 위한 벤치마크 데이터셋 구축 및 평가 지표(Human/LLM-based) 설계
- 공정한 모델 비교를 위한 평가 프로토콜 수립 및 재현성(Reproducibility) 확보
Evaluation Automation 및 Workflow 연동
- Argo Workflows, MLflow 기반의 평가 자동화 환경 구축 및 ML 파이프라인 통합
- 모델 배포 시 성능 저하(Regression) 자동 감지 및 알림 체계 설계
Model Quality Validation 및 운영 고도화
- 반복 가능한 평가 워크플로우를 통한 대규모 모델 품질 및 안정성 검증
- 평가 결과를 바탕으로 한 지속적인 모델 품질 개선 프로세스 운영

Qualifications

Preferred Qualifications

Interview Process

Additional Information

이력서 제출 시 주민등록번호, 가족관계, 혼인 여부, 연봉, 사진, 신체조건, 출신 지역 등 채용절차법상 요구 금지된 정보는 제외 부탁드립니다.
모든 제출 파일은 30MB 이하의 PDF 양식으로 업로드를 부탁드립니다. (이력서 업로드 중 문제가 발생한다면 지원하시고자 하는 포지션의 URL과 함께 이력서를 recruit@42dot.ai으로 전송 부탁드립니다.)
인터뷰 프로세스 종료 후 지원자의 동의하에 평판조회가 진행될 수 있습니다.
국가보훈대상자 및 취업보호 대상자는 관계법령에 따라 우대합니다.
장애인 고용 촉진 및 직업재활법에 따라 장애인 등록증 소지자를 우대합니다.
42dot은 의뢰하지 않은 서치펌의 이력서를 받지 않으며, 요청하지 않은 이력서에 대해 수수료를 지불하지 않습니다.
3개월의 수습기간이 적용될 수 있습니다.

※ 지원 전 아래 내용을 꼭 확인해 주세요.