xAIは2025年7月9日にGrok 4をライブ配信で午後8時(太平洋時間)に発表し、トップレベルのAIモデルとして位置づけました。
このリリースではGrok 3.5をスキップし、高度な機能と強化されたパフォーマンスを導入し、競合他社に挑戦しています。
Grok 4とは?
概要とバリエーション
xAIが開発したGrok 4は、人間の発見を加速させる次世代AIモデルです。
2つのバリエーションを提供します:
汎用モデルはライティング、リサーチ、推論などのタスクに対応し、関数呼び出しや構造化出力をサポートします。一方、Grok 4 Codeは開発者向けにコード生成やバグ検出を強化し、CursorなどのIDEと統合します。
主な機能
Grok 4は13万トークンのコンテキストウィンドウを備え、長い会話や複雑な文書分析を処理します。
当初はテキストベースですが、今後のアップデートでマルチモーダル機能(視覚、画像生成、ビデオ、オーディオ)を追加予定です。
Grok 4 Heavyのマルチエージェントシステムは、協働するAIエージェントにより推論能力を高め、精度を向上させます。
今後のアップデート
今後の強化には、AIコーディングモデル(2025年8月)、マルチモーダルエージェント(2025年9月)、ビデオ生成システム(2025年10月)が含まれ、これらはプレミアム加入者限定です。
Grok 4のパフォーマンスは?
ベンチマーク成果
Grok 4は数学、推論、コーディングでGrok 3を上回ります。主なベンチマークは以下の通りです:
-
GPQA:87(標準)、88(推論)、Grok 3の84.6に対して。
-
Humanity's Last Exam (HLE):25.4%(ツールなし)、44.4%(ツール使用)。
-
SWE-Bench:72(標準)、75(推論)。
-
AIME '25:95、数学的推論で優れています。
パフォーマンスの向上
最適化されたトレーニングと計算リソースにより、これらの成果が実現し、Grok 3.5をスキップした新しいアーキテクチャを採用しました。
マルチエージェントシステムは複雑なクエリの精度をさらに向上させます。
コストとアクセシビリティ
価格構造
Grok 4はxAIのAPIを通じて開発者や企業向けに提供され、SuperGrok Heavyサブスクリプションは月額300ドルで、主要AIプロバイダーの中で最高額です。このプランでは高度な機能への早期アクセスが可能です。
アクセスオプション
Grok 3などの旧モデルはxAIプラットフォーム(grok.com、x.com、モバイルアプリ)で限定的に無料で利用可能ですが、Grok 4の全機能にはプレミアムサブスクリプションまたはAPIが必要です。詳細はx.aiまたはx.ai/apiをご覧ください。
Grok 4と他のAIモデルの比較
モデル | コンテキストウィンドウ | 知能 | 価格(USD/100万トークン) | 出力トークン/秒 | 遅延 |
Grok 4 |
256k
|
73
|
$6.00
|
75.3
|
5.69
|
Gemini 2.5 Pro |
1m
|
70
|
$3.44
|
142.4
|
37.46
|
OpenAI o3 |
200k
|
70
|
$3.50
|
151.2
|
19.32
|
DeepSeek R1 0528 |
128k
|
68
|
$0.96
|
21.5
|
3.69
|
Claude 4 Opus Thinking |
200k
|
64
|
$30.00
|
68.0
|
2.38
|
(データ出典:Artificial Analysis)
強みと弱み
強み:
Grok 4はマルチエージェントシステムにより知能(73)で優れ、複雑な推論やコーディングタスク(AIME '25で95、SWE-Benchで75)に最適です。
256kのコンテキストウィンドウは長時間のタスクをサポートし、100万トークンあたり6.00ドルの価格はコストとパフォーマンスのバランスを取っています。
弱み:
256kのコンテキストウィンドウはGemini 2.5 Proの1Mに比べると小さく、巨大なデータセットの処理には限界があります。
出力速度(75.3トークン/秒)と遅延(5.69秒)は、OpenAI o3やClaude 4に比べリアルタイムアプリケーションには不向きです。
月額300ドルのサブスクリプションはカジュアルユーザーにとって高額です。
競争力
Grok 4は推論とコーディングでリードしていますが、Gemini 2.5 Proの大きなコンテキストウィンドウやOpenAI o3の高速出力に挑戦されています。
DeepSeek R1は抜群のコストパフォーマンスを提供し、Claude 4の低遅延は迅速な応答タスクに適しています。
予定されているマルチモーダルアップデートはGrok 4の汎用性を強化します。

編集者のコメント
Grok 4のリリースは、xAIがAI競争をリードする野心を示す重要な瞬間です。マルチエージェントシステムとGrok 4 Codeバリエーションは、特に開発者や企業にとって際立った革新です。
月額300ドルのサブスクリプションは高額ですが、マルチモーダルアップデートが控えていることからその価値に自信を持っています。
ただし、初期のテキスト専用フォーカスや、GPT-5などの競合と比較したコンテキストウィンドウの小ささが課題です。
xAIの迅速な開発ペースは、Grok 4がAIアプリケーションを再定義する可能性を示唆していますが、約束された機能のタイムリーな提供が重要です。
AIが進化する中、最近の議論で強調された倫理的配慮と中立性は、xAIがユーザー信頼を維持するために取り組むべき重要な課題です。
よくある質問(FAQs)
1. Grok 4とは何ですか?
Grok 4は、2025年7月9日に発売されたxAIの次世代AIモデルで、高度な推論、研究、コーディングタスク向けに設計されており、130,000トークンのコンテキストウィンドウと、将来的なマルチモーダル機能が予定されています。
2. Grok 4はGrok 3とどう異なりますか?
Grok 4は、数学、推論、コーディング(例:AIME '25で95対84.6)でGrok 3を上回り、新しいアーキテクチャとマルチエージェントシステムを備え、Grok 3.5をスキップしています。
3. Grok 4のバリエーションは何ですか?
Grok 4には、ライティングや研究などのタスク向けの汎用モデルと、コード生成やバグ検出に特化した開発者向けツールであるGrok 4 Codeがあります。
4. Grok 4にアクセスする方法は?
Grok 4はxAIのAPIまたはSuperGrok Heavyサブスクリプション(月額300ドル)を通じて利用可能です。Grok 3などの旧モデルは、grok.com、x.com、またはモバイルアプリで制限付きの無料アクセスが可能な場合があります。
5. Grok 4の主な機能は何ですか?
130,000トークンのコンテキストウィンドウ、マルチエージェント推論、2025年8月から予定されているマルチモーダル更新(ビジョン、画像生成、ビデオ、オーディオ)を提供します。
6. Grok 4は他のAIモデルと比べてどうですか?
Grok 4は知能(73)およびコーディング(SWE-Benchで75)で優れていますが、コンテキストウィンドウ(256k)や出力速度(75.3トークン/秒)はGemini 2.5 ProやOpenAI o3に比べると劣ります。
7. Grok 4の利用コストは?
SuperGrok Heavyサブスクリプションは月額300ドル、APIの価格は100万トークンあたり6.00ドルです。詳細はx.aiまたはx.ai/apiをご覧ください。
8. Grok 4の今後のアップデート予定は?
今後のアップデートには、AIコーディングモデル(2025年8月)、マルチモーダルエージェント(2025年9月)、ビデオ生成システム(2025年10月)が含まれており、プレミアムサブスクライバーのみに提供されます。
9. Grok 4はリアルタイムアプリケーションに適していますか?
出力速度(75.3トークン/秒)およびレイテンシ(5.69秒)が中程度であるため、Claude 4やOpenAI o3などのモデルに比べ、リアルタイムタスクにはあまり適していません。
10. xAIはGrok 4でどのように倫理的なAI利用を確保していますか?
xAIはユーザー信頼を維持するために中立性と倫理的配慮を重視していますが、具体的な対策は記事で詳細に述べられていません。