2 분 소요

지난 주 오픈 AI에서 최고 성능 추론 모델인 o3-pro를 발표하고, o3 가격도 80%로 인하해 개발자에게 더 저렴한 옵션을 제공했는 데, 이에 대해 간단히 정리해 보겠다.

1. LLM 토큰 및 API

  • 토큰 정의: LLM이 단어, 구문, 수학 및 코딩 문자열, 기타 콘텐츠를 나타내는 데 사용하는 개별 숫자 문자열
  • 토큰의 역할: 모델이 학습을 통해 습득한 의미론적 구성의 표현, LLM의 기본 언어
  • API 제공 방식: 대부분의 LLM 제공업체는 개발자가 앱을 구축하거나 외부 앱에 연결할 수 있는 API를 통해 모델을 제공하고, 토큰당 비용을 부과

2. o3 가격 인하 배경

  • 고급 추론 기능에 대한 접근성 향상: 개발자가 고급 추론 기능을 더 쉽게 활용할 수 있도록 가격 인하
  • 경쟁 모델과의 가격 경쟁 심화: Google DeepMind의 Gemini 2.5 Pro, Anthropic의 Claude Opus 4, DeepSeek의 추론 제품군 등 경쟁 모델과의 가격 경쟁 심화

3. 샘 알트먼의 가격 인하 발표

  • 가격 인하 발표: OpenAI CEO는 X(트위터)를 통해 o3 가격을 80% 인하한다고 발표하며, 더 광범위한 실험을 장려하기 위한 것이라고 밝힘
  • 새로운 가격: o3 사용 비용은 이제 입력 토큰 100만 개당 2달러 (약 2,600원), 출력 토큰 100만 개당 8달러 (약 10,400원)이며, 이전에 제공한 정보와 동일한 “캐시된” 정보를 입력하면 토큰 100만 개당 0.50달러 (약 650원) 추가 할인 제공

  • 가격 인하의 의미
    • 기존 가격 대비 대폭 인하: OpenAI 연구원 Noam Brown은 X(트위터)를 통해 기존 가격(입력 10달러 (약 13,000원), 출력 40달러 (약 52,000원))에서 크게 인하된 가격이라고 강조
    • 개발자의 긍정적 반응: 개발자 레이 퍼난도(Ray Fernando)는 “LFG!(Let’s Fucking Go!)”라는 게시물을 통해 가격 인하를 환영하며 프로젝트 확장 기대
  • 경쟁 LLM과의 가격 비교
    • AI 제공업체 간 경쟁 심화: AI 제공업체는 성능과 가격 경쟁력을 높이기 위해 노력 중
    • Gemini 2.5 Pro Preview (Google DeepMind): 프롬프트 크기에 따라 입력 125만~250만원, 출력 1,300만~1,950만원 부과, Google Search와 통합되어 추가 기능 제공하지만, 해당 서비스는 별도 비용 발생 (하루 1,500건 요청까지 무료, 이후 1,000건당 35달러 (약 45,500원))
    • Claude Opus 4 (Anthropic): 복잡한 작업에 최적화된 모델로, 입력 1,950만원, 출력 9,750만원 부과, 프롬프트 캐싱 읽기/쓰기 서비스는 각각 195만원/2,440만원 부과, 일괄 처리 시 50% 할인 제공
    • DeepSeek 모델 (DeepSeek-Reasoner, DeepSeek-Chat): 공격적인 저가 정책으로 시장 가격 인하, 입력 토큰은 캐싱 및 시간에 따라 9.1만~71.5만원, 출력은 143만~284.7만원, 비수기에는 캐시된 입력에 대해 3.9만원까지 가격 인하
  • 개발자를 위한 비용 및 지능 격차 해소
    • OpenAI의 가격 인하: DeepSeek와 같은 초저가 모델과의 격차를 좁힐 뿐만 아니라 Claude Opus 및 Gemini Pro와 같은 고가 제품에 대한 가격 인하 압력 가중
    • o3의 유연한 처리 모드: 동기식 처리를 위해 토큰 100만 개당 입력 650만원, 출력 2,600만원을 부과하는 유연한 모드를 제공하여 개발자가 워크로드 유형에 따라 컴퓨팅 비용과 대기 시간을 더 효과적으로 제어 가능

4. 독립적인 AI 모델 비교 및 연구 그룹의 벤치마킹 테스트 결과

  • Artificial Analysis의 벤치마킹 테스트: 새로운 o3는 모든 작업을 완료하는 데 390달러 (약 50.7만원)의 비용이 소요, Gemini 2.5 Pro는 971달러 (약 126만원), Claude 4 Sonnet은 342달러 (약 44.5만원) 소요

5. o3 접근성 향상

  • OpenAI API 및 Playground를 통해 o3 사용 가능: 소액 잔액으로도 모델의 모든 기능 탐색 가능, 재정적 장벽 없이 프로토타입 제작 및 배포 가능
  • 스타트업, 연구팀, 개인 개발자에게 특히 유리: 기존에는 높은 모델 접근 비용으로 인해 어려움을 겪었던 사용자에게 큰 혜택 제공

6. 결론 및 참고사항

댓글남기기