OpenAIは、推論技術における大きな進歩であるo3-proモデルを発表しました。
本日よりChatGPT ProおよびTeamサブスクライバー向けに提供が開始され、来週にはエンタープライズ向けのアクセスが予定されています。このモデルは、OpenAIの開発者APIを通じて利用可能です。
複雑なタスクを処理するために設計されたo3-proは、技術や教育などの分野で注目を集めています。
以下に、その機能、コスト、他のモデルとの比較について詳細な概要を説明します。
o3-Proとは?
強化された問題解決能力
o3-proは、従来のo1-proに代わるOpenAIの最も先進的な推論モデルです。
難しい問題を解決するために一時停止してアプローチを調整する能力を持ち、数学、科学、コーディングにおいて非常に効果的です。
この機能により、慎重なステップごとの分析が必要なタスクに対応できます。
実際の用途
このモデルは、ウェブ検索、ファイル分析、Pythonコード実行などのツールをサポートし、現実世界の課題に取り組むことができます。
たとえば、1つの複雑なタスクを解決するために600回のツール操作を使用した例があり、詳細なプロセスを管理する能力を示しています。
パフォーマンスはどうか?
優れたベンチマーク結果
o3-proは、AIME 2024数学コンペティションで96.7%、ARC-AGI推論ベンチマークで87.7%を記録し、多くの人間の専門家を上回りました。プログラミングプラットフォームCodeforcesでは、Eloスコア2727を達成し、o1モデルの1891を大きく上回っています。
幅広い機能
テキストに加えて、o3-proは画像やその他のデータを処理でき、視覚分析やマルチメディア研究などのタスクに適しています。
ただし、画像生成やChatGPTでの一時的なチャットはサポートしておらず、一部のシナリオでは使用が制限される場合があります。
コストとアクセス
価格体系
APIを通じて、o3-proは入力トークン100万あたり20ドル、出力トークン100万あたり80ドルで、約75万語の入力を処理できます。
対照的に、2025年6月10日に80%値下げされた標準o3モデルは、トークン100万あたり2ドル/8ドルです。
ChatGPT Proユーザーは月額200ドルのサブスクリプションでo3-proにアクセスでき、エンタープライズおよび教育向けのアクセスは来週から開始されます。
誰が利用できる?
現在、ChatGPT ProおよびTeamサブスクライバーと、APIを介した開発者がこのモデルを利用できます。エンタープライズおよび教育ユーザーは近日中にアクセスが可能になり、専門的および学術的な環境での利用が拡大します。
他のモデルとの比較
GoogleのGemini 2.5 Pro
GoogleのGemini 2.5 Proは、トークン100万あたり1.25~2.50ドル/10~15ドルで、コンテキストウィンドウが大きい(100万トークン対o3-proの20万トークン)ですが、AIME 2024のような推論タスクでは劣ります。マルチメディアタスクには依然として強力な選択肢です。
AnthropicのClaude 4 Opus
AnthropicのClaude 4 Opusは会話タスクで優れた性能を発揮しますが、数学やコーディングではo3-proに劣ります。価格は競争力がありますが、正確な料金は公開されておらず、言語に特化したニーズに適した選択肢です。
DeepSeekのR1
DeepSeekのR1は、トークン100万あたり0.14ドル/0.55ドルと低コストで、ベンチマークスコアもまずまずです。ただし、o3-proのツールサポートがなく、中国拠点の運営によるデータセキュリティの懸念があります。

編集者のコメント
o3-proは、特に研究やソフトウェア開発などの専門分野において、推論技術の顕著な進歩を示しています。
その高価格は性能を反映していますが、標準o3モデルの値下げは、OpenAIがアクセスを広げる努力を示しています。
GoogleやAnthropicなどの競合他社は実行可能な代替手段を提供しますが、技術的性能ではo3-proがリードしています。
DeepSeekのR1のような予算に優しいモデルは、データセキュリティの懸念が解消されれば、一部にアピールするかもしれません。
ユーザー要求を評価するなどの安全機能の導入は、これらのツールが重要なアプリケーションで中心的な役割を果たすようになる中で、前向きな一歩です。
今後の価格調整や競合他社の対応が、このモデルの影響をさらに形作る可能性があります。