25 марта 2025 года Google DeepMind представила Gemini 2.5 Pro — передовую модель искусственного интеллекта, разработанную для решения сложных задач в области логики, науки и программирования.
Являясь последней версией в серии Gemini, эта модель основана на своем предшественнике — Gemini 2.0 Pro, и демонстрирует значительные улучшения в тестах производительности.
Цена и доступность
Gemini 2.5 Pro доступна через подписку Gemini Advanced, а стоимость для разработчиков будет объявлена в ближайшее время.
Для индивидуальных пользователей Gemini 2.5 Pro доступна через подписку Gemini Advanced, которая стоит 19,99 долларов в месяц.
Разработчики могут получить доступ через Google AI Studio, подробности о ценах будут представлены в ближайшие недели. Также скоро модель станет доступна на платформе Vertex AI.
Ключевые особенности и улучшения
Gemini 2.5 Pro выделяется в задачах, требующих глубокого логического мышления и научных знаний. Результаты тестов показывают заметное улучшение по сравнению с предыдущими моделями:
(Источник: Google)
Превосходные способности в логике и науке
- Humanity's Last Exam (Логика и знания): 18,8%, что значительно превосходит GPT-4.5 от OpenAI (6,4%).
- GPQA Diamond (Научное мышление): 84,0%, опережая GPT-4.5 (79,7%).
- AIME 2024 (Математика): 92,0%, что существенно выше, чем 72% у Gemini 2.0 Pro.
Эти результаты говорят о том, что Gemini 2.5 Pro особенно подходит для приложений, требующих логических выводов, научного анализа и решения математических задач.
Продвинутые возможности программирования и мультимодальность
Модель демонстрирует высокую производительность в программировании, хотя в некоторых областях она остается конкурентоспособной, а не доминирующей:
- SWE-bench Verified (Агентное программирование): 63,8%, отставая от Claude 3.7 Sonnet (70,3%).
Кроме того, Gemini 2.5 Pro поддерживает мультимодальные входные и выходные данные, позволяя создавать анимации, симуляции и интерактивные приложения на основе простых запросов.
Расширенное окно контекста для обработки больших данных
Одной из выдающихся особенностей Gemini 2.5 Pro является огромное окно контекста в 1 миллион токенов, с планами расширения до 2 миллионов токенов.
Это делает модель особенно полезной для обработки больших наборов данных, длинных документов и сложных сценариев решения задач без потери контекста.

Сравнение с другими ведущими моделями ИИ
Превосходит GPT-4.5, конкурирует с Claude 3.7 Sonnet
Сравнение тестов показывает, что Gemini 2.5 Pro превосходит GPT-4.5 от OpenAI в логике и науке, при этом тесно конкурируя с Claude 3.7 Sonnet в задачах программирования:
Gemini 2.5 Pro | GPT-4.5 | Claude 3.7 Sonnet | |
---|---|---|---|
Humanity's Last Exam (Логика) | 18,8% | 6,4% | 8,9% |
GPQA Diamond (Наука) | 84,0% | 79,7% | 80,2% |
AIME 2024 (Математика) | 92,0% | 61,3% | 83,9% |
LiveCodeBench v5 (Генерация кода) | 70,4% | - | 70,6% |
SWE-bench Verified (Агентное программирование) | 63,8% | 70,3% | - |
Эти результаты подчеркивают сильные стороны Gemini 2.5 Pro в логике и науке, но указывают на необходимость улучшений в некоторых задачах программирования по сравнению с Claude 3.7 Sonnet.
Улучшения по сравнению с Gemini 2.0 Pro
По сравнению с предшественником Gemini 2.5 Pro демонстрирует значительный прогресс в ряде тестов:
- GPQA Diamond (Наука): Увеличение с 62% до 84%
- Humanity’s Last Exam (Логика): Улучшение с 7,7% до 18,8%
- LiveCodeBench (Программирование): Рост с 47% до 70,4%
- AIME 2024 (Математика): Повышение с 72% до 92%
Эти улучшения свидетельствуют о том, что Google DeepMind значительно усовершенствовала возможности модели в области логики, науки и программирования за счет доработки архитектуры и обработки обучающих данных.
💡 Узнайте больше о Google Gemini 2.0 Pro
Комментарий редактора
С выпуском Gemini 2.5 Pro компания Google DeepMind продолжает расширять границы возможностей ИИ, особенно в области логического мышления и научного анализа.
Хотя модель превосходит многих конкурентов в этих сферах, её способности в программировании остаются конкурентными, а не революционными по сравнению с моделями Claude от Anthropic.
Расширенное окно контекста и мультимодальные возможности делают её мощным инструментом для исследователей, разработчиков и компаний, работающих с задачами, основанными на больших данных.
В перспективе ожидаемое расширение окна контекста до 2 миллионов токенов может ещё больше повысить её способность эффективно обрабатывать огромные объемы информации, что потенциально установит новый стандарт в индустрии для крупномасштабных приложений ИИ.
Однако окончательное влияние будет зависеть от того, насколько успешно модель интегрируется в корпоративные среды через Vertex AI и как будет развиваться структура цен для разработчиков, ищущих масштабируемые решения.