Google представил свою новейшую модель генерации видео с использованием искусственного интеллекта - Veo 2, что является значительным прорывом в области синтетических медиа.
Это объявление следует за запуском Gemini 2 на прошлой неделе и последующим выпуском ожидаемого OpenAI's Sora.
Продвинутые функции Veo 2
Veo 2 имеет возможность генерировать видео с потрясающим разрешением 4K и длительностью до двух минут. Эта новая модель обладает улучшенным пониманием физических принципов, движений человека и ключевых кинематографических приемов, таких как выбор объектива и камерных углов.
Каждое видео, созданное с помощью Veo 2, содержит встроенную технологию цифровой водяной метки SynthID, которая предназначена для идентификации контента, созданного искусственным интеллектом, и борьбы с угрозой deepfake.
Виртуозное владение кинематографическим языком
Одной из выдающихся характеристик Veo 2 является его способность интерпретировать кинематографический язык. Пользователи могут определить специфические элементы, такие как тип объектива и камерные углы, что позволяет создавать яркие визуальные снимки.
Например, пользователи могут заказывать динамичные слежения или интимные крупные планы, демонстрируя потенциал модели для творческих профессионалов, которые хотят быстро прототипировать идеи.
Ограничения и практическое использование
Несмотря на впечатляющие возможности, Veo 2 сейчас имеет ограниченную практическую применимость. Хотя в теории он способен создавать видео высокого качества 4K, его публичный интерфейс через VideoFX ограничивает выходное разрешение до 720p и максимальную длительность восьми секунд.
Команда DeepMind признает, что у модели все еще есть проблемы, особенно с поддержанием последовательности в сложных сценах или интригующих движениях.
Планы на будущее
Veo 2 считается серьезным обновлением по сравнению с предыдущей моделью, которая была запущена в мае. Google планирует внедрить эту новую модель в различные платформы, включая YouTube Shorts, в 2025 году. Заинтересованные пользователи могут присоединиться к списку ожидания для VideoFX через Google Labs, чтобы получить доступ к модели.
Комментарий редактора
Veo 2 представляет собой значительный шаг в развитии генерации AI-видео, предлагая расширенные возможности, которые могут изменить творческие рабочие процессы.
Однако его текущие ограничения подчеркивают продолжающиеся трудности в достижении безукоризненного видеоролика. По мере интеграции этой технологии в основные приложения Google, потенциал для создания инновационного контента будет продолжать расти.