Googleは、合成メディアの分野における重要な進展である最新のAIビデオ生成モデル、Veo 2を発表しました。
この発表は、先週のGemini 2のローンチに続き、待望のリリースを果たしたOpenAIのSoraに続くものです。
Veo 2の高度な機能
Veo 2は、見事な4K解像度のビデオを生成する能力を持ち、最大2分の長さまで対応しています。この新しいモデルは、物理的原理、人間の動き、レンズの選択やカメラアングルといった主要な映画撮影技術の理解が向上しています。
Veo 2で生成された各ビデオにはSynthIDデジタルウォーターマーキング技術が埋め込まれており、AIで生成されたコンテンツを識別し、ディープフェイクの増加に対抗することができます。
映画的な言語のマスタリー
Veo 2の特徴の一つは、映画的な言語の解釈能力です。ユーザーは具体的な要素(例:レンズの種類やカメラアングル)を定義することができ、視覚的に魅力的なショットを作成することが可能です。
たとえば、ユーザーはダイナミックなトラッキングショットや親密なクローズアップを要求することができ、アイデアのプロトタイプを素早く作成するための潜在能力を示しています。
制約と実用上の利用
Veo 2は素晴らしい機能を備えていますが、実用面では制約があります。理論上は高品質な4Kビデオを生成できるものの、VideoFXを通じた一般公開インターフェースでは720p解像度と最大8秒の長さに制限されています。
DeepMindチームは、まだ複雑なシーンや緻密な動きにおいて一貫性を保持することについて課題があると認識しています。
将来の統合計画
Veo 2は、5月に発売された前モデルからの大幅なアップグレードと見なされています。Googleは、この新しいモデルを2025年にYouTube Shortsを含むさまざまなプラットフォームに組み込む予定です。興味のあるユーザーは、Google LabsのVideoFXの待ちリストに参加してモデルにアクセスすることができます。
編集者のコメント
Veo 2は、クリエイティブなワークフローを再構築する可能性がある強化された機能を提供するAIビデオ生成における大きな進歩を表しています。
ただし、現在の制約は、シームレスなビデオ制作を実現するための持続的な課題を浮き彫りにしています。Googleがこの技術を主流のアプリケーションに統合するにつれ、革新的なコンテンツ作成の可能性はますます拡大していくでしょう。