OpenAI는 추론 기술에서 큰 진전을 이룬 o3-pro 모델을 발표했습니다.
오늘부터 ChatGPT Pro 및 Team 구독자를 대상으로 제공되며, 다음 주에는 엔터프라이즈 액세스가 예정되어 있습니다. 이 모델은 OpenAI의 개발자 API를 통해 이용할 수 있습니다.
복잡한 작업을 처리하도록 설계된 o3-pro는 기술과 교육 등 다양한 분야에서 주목받고 있습니다.
아래는 기능, 비용, 그리고 다른 모델과의 비교에 대한 자세한 개요입니다.
o3-Pro란 무엇인가?
향상된 문제 해결 능력
o3-pro는 기존 o1-pro를 대체하는 OpenAI의 가장 진보된 추론 모델입니다.
어려운 문제를 해결하기 위해 일시 중지하고 접근 방식을 조정할 수 있어 수학, 과학, 코딩에서 매우 효과적입니다.
이 기능은 신중한 단계별 분석이 필요한 작업을 처리할 수 있게 합니다.
실용적 사용 사례
이 모델은 웹 검색, 파일 분석, Python 코드 실행과 같은 도구를 지원하여 실제 문제를 해결할 수 있습니다.
예를 들어, 단일 복잡한 작업을 해결하기 위해 600번의 도구 상호작용을 사용한 사례가 있으며, 이는 상세한 프로세스 관리 능력을 보여줍니다.
성능은 어떠한가?
뛰어난 벤치마크 결과
o3-pro는 AIME 2024 수학 경진대회에서 96.7%, ARC-AGI 추론 벤치마크에서 87.7%를 기록하며 많은 인간 전문가를 능가했습니다. 프로그래밍 플랫폼 Codeforces에서는 Elo 점수 2727을 달성하여 o1 모델의 1891을 크게 앞질렀습니다.
광범위한 기능
텍스트 외에도 o3-pro는 이미지 및 기타 데이터를 처리할 수 있어 시각 분석이나 혼합 미디어 연구와 같은 작업에 적합합니다.
다만, 이미지 생성이나 ChatGPT의 임시 채팅은 지원하지 않아 일부 시나리오에서는 사용이 제한될 수 있습니다.
비용 및 액세스
가격 구조
API를 통해 o3-pro는 입력 토큰 100만 개당 20달러, 출력 토큰 100만 개당 80달러로, 약 75만 단어의 입력을 처리할 수 있습니다.
반면, 2025년 6월 10일에 80% 가격 인하된 표준 o3 모델은 토큰 100만 개당 2달러/8달러입니다.
ChatGPT Pro 사용자는 월 200달러 구독으로 o3-pro에 액세스할 수 있으며, 엔터프라이즈 및 교육 액세스는 다음 주에 시작됩니다.
누가 사용할 수 있는가?
현재 ChatGPT Pro 및 Team 구독자와 API를 통한 개발자가 이 모델을 이용할 수 있습니다. 엔터프라이즈 및 교육 사용자는 곧 액세스할 수 있어 전문 및 학술 환경에서의 활용이 확대될 것입니다.
다른 모델과의 비교
Google의 Gemini 2.5 Pro
Google의 Gemini 2.5 Pro는 토큰 100만 개당 1.25~2.50달러/10~15달러로, 더 큰 컨텍스트 윈도우(100만 토큰 대 o3-pro의 20만 토큰)를 지원하지만 AIME 2024와 같은 추론 작업에서는 뒤처집니다. 멀티미디어 작업에는 여전히 강력한 선택입니다.
Anthropic의 Claude 4 Opus
Anthropic의 Claude 4 Opus는 대화 작업에서 좋은 성능을 발휘하지만, 수학 및 코딩에서는 o3-pro에 비해 뒤처집니다. 가격은 경쟁력이 있지만 정확한 요금은 공개되지 않아 언어 중심의 요구에 적합한 선택입니다.
DeepSeek의 R1
DeepSeek의 R1은 토큰 100만 개당 0.14달러/0.55달러로 저렴하며 벤치마크 점수도 준수합니다. 하지만 o3-pro의 도구 지원이 부족하고, 중국 기반 운영으로 인해 데이터 보안 우려가 있습니다.

편집자의 코멘트
o3-pro는 특히 연구 및 소프트웨어 개발과 같은 전문 분야에서 추론 기술의 주목할 만한 발전을 나타냅니다.
높은 가격은 그 성능을 반영하지만, 표준 o3 모델의 가격 인하는 OpenAI가 접근성을 확대하려는 노력을 보여줍니다.
Google 및 Anthropic과 같은 경쟁사는 실행 가능한 대안을 제공하지만, 기술적 성능에서는 o3-pro가 앞서 있습니다.
DeepSeek의 R1과 같은 예산 친화적인 모델은 데이터 보안 우려가 해결된다면 일부 사용자에게 매력적일 수 있습니다.
사용자 요청을 평가하는 등의 안전 기능 포함은 이러한 도구가 중요한 응용 프로그램에서 중심적인 역할을 하게 되면서 긍정적인 단계입니다.
향후 가격 조정이나 경쟁사의 대응은 이 모델의 영향력을 더욱 형성할 수 있습니다.