OpenAI, 역대 최고 지능형 추론 모델 o3와 o4-mini 공개
OpenAI가 지금까지 등장한 모델 중 가장 지능적인 추론 모델 o3와 경량 고효율 모델 o4-mini를 새롭게 공개했다. 이번 모델들은 단순한 언어 처리 능력을 넘어서, 도구 사용 능력과 시각적 추론 기능까지 통합하며 AI의 새로운 진화를 보여주고 있다. 요약하자면 다음과 같다.
1. 모델 공개 및 적용 대상
- OpenAI는 공식 블로그를 통해
o3
와o4-mini
모델을 공개하고, ChatGPT Plus, Teams, Pro 등 유료 사용자에게 즉시 제공한다고 밝혔음.
2. 주요 특징
-
도구 사용 능력 내장
- 웹 브라우징, 파이썬 코드 실행, 이미지 분석 및 생성 등 ChatGPT의 모든 내장 도구 사용 가능
- API 함수 호출을 통해 사용자 정의 도구까지 호출 가능
- 모델 스스로 언제 도구를 사용할지 판단하고, 실제로 도구를 사용해 추론을 진행함
-
내장 멀티모달 추론과 이미지 기반 사고
-
텍스트 뿐만 아니라 이미지 기반 추론까지 수행
-
흐릿하거나 반전된 이미지도 도구를 활용해 분석 및 이해
-
OpenAI는 이를 두고 “이미지로 사고하는 모델” 이라 표현
-
-
강화 학습 기반 성능 최적화
-
반복된 강화 학습을 통해 추론 능력 강화
-
동일한 비용과 지연 시간으로도 더 높은 성능 발휘
-
기존보다 더 유연하고 전략적인 문제 해결 방식 제공
-
-
성능 및 벤치마크
- SWE-Bench (코딩 테스트) 성능: o3: 69.1%, o4-mini: 68.1% → 기존 o3-mini (49.3%) 및 Claude 3 Sonnet (62.3%) 대비 높은 수치
3. 비용
o3는 o1보다 성능은 향상, 지연 시간과 비용은 동일 또는 더 저렴함.
모델 | 입력 (1M 토큰) | 출력 (1M 토큰) |
---|---|---|
o3 | $10.00 | $40.00 |
o4-mini | $1.10 | $4.40 |
o1 | $15.00 | $60.00 |
o1-pro | $150.00 | $600.00 |
4. 향후 계획
o3와 o4-mini는 단순한 언어 모델이 아닌, 멀티모달 능력과 도구 활용 능력까지 갖춘 진정한 추론 AI로 평가받고 있다. 특히, 이미지로 사고하고, 상황에 따라 전략적으로 도구를 활용하는 능력은 앞으로의 AI 활용 방식에 큰 전환점을 가져올 것이다.
저의 생각은 앞으로 AI가 단순한 답변만 생성하는 것을 넘어, 스스로 문제를 정의하고 도구를 활용해 해결하는 에이전트형 AI로 진화하는 흐름을 가중화할 것이다.
댓글남기기