Metaは、2025年4月5日にリリースされた先進的なAIモデルファミリー「Llama 4」を発表しました。これは人工知能技術における重要な節目となります。
この記事では、Llama 4の主要な特徴や前モデルからの改良点、競合モデルとの比較を詳しく解説し、進化するAIの状況におけるその役割を明確に示します。
背景と開発の経緯
Llama 4は、2023年に開始されたMetaのLlamaシリーズを基盤とし、3つのモデルScout、Maverick、Behemothで構成されています。
エキスパート混合(MoE)アーキテクチャと早期融合技術を採用しており、テキスト、画像、動画の処理に優れ、DeepSeekやGPTといったモデルとの競争が激化する中で際立っています。
リリース詳細と利用可能性
2025年4月5日にリリースされたLlama 4のScoutとMaverickは、Hugging Faceなどのプラットフォームからダウンロード可能です。
最大規模のBehemothは現在トレーニング中で、プレビュー版が提供されています。
これらのモデルは、WhatsAppやInstagram DirectなどのアプリでMeta AIに統合されていますが、マルチモーダル機能は現時点で米国英語のみに対応しています。
Llama 4 Scout、Maverick、Behemothの違い
Llama 4の3つのバリエーションは、それぞれ異なるニーズに対応します:
Llama 4 Scout
1090億パラメータと16のエキスパートを備えたScoutは軽量で、単一のNvidia H100 GPUで動作します。
1000万トークンのコンテキストウィンドウを備え、ドキュメント要約などの長文タスクに優れており、価格は100万トークンあたり0.26ドルです。
Llama 4 Maverick
4000億パラメータと128のエキスパートを誇るMaverickは、高性能ニーズを対象としており、Nvidia H100 DGXシステムが必要です。
100万トークンのコンテキストと優れたコーディング・推論能力を両立し、価格は100万トークンあたり0.40ドルです。
Llama 4 Behemoth
プレビュー段階で約2兆パラメータを持つBehemothは、最も強力で、最先端のSTEMアプリケーション向けに設計されています。
大規模なハードウェアを必要とし、完全にトレーニングが完了すればトップモデルに匹敵する性能が期待されます。
Llama 3からの主な進化
Llama 4は、Llama 3から大幅なアップグレードを遂げ、さまざまな分野での有用性を高めています。
拡大したコンテキストウィンドウ
Llama 4 Scoutのコンテキストウィンドウは1000万トークンで、Llama 3の12万8000トークンを大きく上回ります。
このアップグレードにより、複数のドキュメントの要約や大規模なコードベースの分析といった複雑なタスクをサポートし、開発者にとっての利便性が向上しています。
多言語サポートの強化
200言語でトレーニングされ、Llama 3の10倍の多言語トークンを扱うLlama 4は、アラビア語、ヒンディー語、フランス語などグローバルな使用に対応しています。
これにより、多様な国際的アプリケーションに適した強力な選択肢となっています。
アーキテクチャとパフォーマンスの向上
MoEアーキテクチャを採用し、Scoutは1090億パラメータ、Maverickは4000億パラメータで、コーディング、推論、画像処理の効率とパフォーマンスが向上しています。
また、バイアスを削減し、議論の多いトピックでの拒否率を7%から2%未満に低下させました。
競合モデルとの比較
モデル | 提供元 | コンテキストウィンドウ | 知能スコア | 価格($/百万トークン) | 出力速度(トークン/秒) | 遅延(秒) |
Llama 4 Maverick | Meta | 100万 | 49 | 0.40 | 127.2 | 0.36 |
Llama 4 Scout | Meta | 1000万 | 36 | 0.26 | 104.1 | 0.33 |
GPT-4o | OpenAI | 12万8000 | 50 | 7.50 | 212.2 | 0.55 |
Gemini 2.5 Pro | 100万 | 68 | 3.44 | 157.9 | 35.88 | |
Gemini 2.0 Flash | 100万 | 48 | 0.17 | 248.3 | 0.30 |
(データソース:Artificial Analysis)
トップモデルとの性能比較
Llama 4 Maverickは、コーディング、推論、多言語タスクでGPT-4oやGemini 2.0を上回りますが、一部のベンチマークではGemini 2.5 ProやClaude 3.7 Sonnetに後れを取っています。
Behemothは、完全にトレーニングが完了すれば、特にSTEM分野でこれらのリーダーと競合する可能性があります。
コストとオープンソースの優位性
(データソース:Meta)
Scoutの100万トークンあたり0.26ドルに対し、GPT-4oは7.50ドルであり、Llama 4はコスト効率の高い代替手段を提供します。
オープンソースであるためカスタマイズが可能で、独自モデルに対して優位性を持ち、開発者へのアクセスを広げています。
今後の影響
Llama 4のマルチモーダル機能と手頃な価格は、教育や医療などの産業を変革し、革新的なAIアプリケーションを可能にする可能性があります。
そのオープンソース性は競争環境を均等化し、競争と創造性を促進するかもしれません。

編集者のコメント
Llama 4は、Metaが独自AI大手に対抗する大胆な一手として際立っています。そのコスト効率と柔軟性は、小規模な組織が先進的なAIを採用する力を与え、産業のダイナミクスを変える可能性があります。
すべての分野でトップパフォーマーではないものの、特にBehemothの進展を考えると、Metaが将来のAI進化をリードし、アクセシビリティとパフォーマンスの新たな基準を打ち立てることを目指していることがうかがえます。