AWS re:Invent 2025, проходившая в Лас-Вегасе с 1 по 5 декабря, была сосредоточена на одной ключевой теме: корпоративные AI-агенты, инструменты для настройки моделей и облачная инфраструктура следующего поколения.
На ключевых выступлениях и презентациях продуктов AWS представила конференцию этого года как поворотный момент от AI «ассистентов» к автономным агентам, способным планировать, программировать и выполнять задачи самостоятельно.
Что изменилось: основные моменты шоу
AI-агенты становятся полноценными облачными продуктами
AWS усилила AgentCore (Bedrock) и связанные сервисы, чтобы компании могли создавать, оценивать и управлять автономными агентами в масштабе. Новые функции AgentCore включают Policy engine для детерминированного контроля выполнения, эпизодическую память для ведения журналов и запоминания контекста пользователя, а также 13 встроенных систем оценки для непрерывного контроля качества.
Эти дополнения перемещают управление агентами из кода приложения в управляемые инструменты, упрощая соблюдение требований и управление рисками.
Более мощное и экологичное оборудование для обучения — Trainium3 и UltraServers
AWS представила чип Trainium3 и EC2 Trn3 UltraServers, обещая многократное повышение производительности и значительное снижение энергопотребления. Trainium3 и линейка UltraServer нацелены на более быстрое обучение и снижение общей стоимости владения, а AWS анонсировала Trainium4 с планируемой совместимостью с технологией Nvidia NVLink для большей гибкости мультивендорных кластеров. Эти шаги демонстрируют стремление AWS к вертикально интегрированной AI-инфраструктуре.
Упрощённая автоматизация настройки моделей (Bedrock + SageMaker)
Amazon расширила возможности настройки моделей в Bedrock и SageMaker AI.
Основные нововведения: безсерверная настройка моделей в SageMaker (не требуется планирование инфраструктуры) и Reinforcement Fine-Tuning (RFT) в Bedrock, которая автоматизирует процессы настройки на основе вознаграждения для повышения точности выполнения задач без больших размеченных наборов данных.
Эти функции позволяют командам быстрее переходить от корректировки запросов к моделям производственного уровня.
Семейство Nova и Nova Forge — передовые модели + контроль клиентов
AWS представила новые модели Nova и сервис Nova Forge, позволяющие клиентам использовать предварительно обученные или частично обученные модели Nova и дообучать их на собственных данных. Nova Forge обеспечивает дополнительное обучение с использованием закрытых наборов данных, предоставляя AWS гибкую альтернативу для компаний, желающих использовать передовые модели в облачной среде.
Ценовые и коммерческие стимулы: Database Savings Plans и кредиты для стартапов
AWS анонсировала Database Savings Plans, позволяющие снизить расходы на базы данных до 35% при годовых обязательствах с почасовым применением к поддерживаемым сервисам БД.
Отдельно Kiro (AI-сервис для разработчиков AWS) получает функции автономных агентов и бесплатные кредиты для квалифицированных стартапов на ранней стадии в некоторых странах — коммерческий шаг для ускорения внедрения.
Глубокий анализ: выбранные анонсы и их последствия
Безопасность, память и оценка агентов — формирование доверия
Policy в AgentCore позволяет компаниям определять правила, блокирующие или регистрирующие действия агента во время выполнения (например, ограничение возвратов или запрет определённых вызовов инструментов). Эпизодическая память даёт агентам краткосрочную и среднесрочную возможность запоминать предпочтения пользователей, улучшая непрерывность работы. Оценки предоставляют встроенные показатели (полезность, точность, выбор инструментов), поддерживающие мониторинг поведения агента в стиле CI/CD.
В совокупности эти функции снижают барьер для внедрения агентов в регулируемых или высокорисковых средах.
Практические последствия
- Более быстрые проверки соответствия, так как политики можно менять централизованно.
- Лучшее персонализированное взаимодействие без утечки долгосрочных персональных данных при контролируемых окнах памяти.
- Непрерывный мониторинг снижает количество инцидентов в производстве из-за отклонений агентов.
Trainium3, UltraServers и будущее с NVLink
Trainium3 обещает до 4× увеличение производительности для обучения и инференса при снижении энергопотребления на 40%, согласно брифингам AWS; Trn3 UltraServers предоставляют серверные системы для использования этих чипов. AWS уже планирует Trainium4 с совместимостью NVLink, сигнализируя о намерении взаимодействовать с GPU-сетками Nvidia и строить мультивендорные AI-кластеры.
Это снижает риски зависимости от одного поставщика, сохраняя экономику кастомного кремния AWS.
Reinforcement Fine-Tuning и безсерверная настройка
RFT в Bedrock превращает настройку на основе вознаграждения в управляемый рабочий процесс, что, по данным AWS, обеспечивает значительное улучшение точности по сравнению с базовыми моделями.
Безсерверная настройка моделей в SageMaker позволяет командам итеративно работать с моделями без проектирования инфраструктуры заранее — это повышает продуктивность для небольших команд и ускоряет прототипирование.
Быстрая таблица сравнения: выбранные опции вычислений и моделей
|
Функция / Продукт |
Основное назначение | Заметные характеристики |
|---|---|---|
| Trainium3 + Trn3 UltraServer | Высокопроизводительное облачное обучение | До ~4× производительности; ~40% меньше энергии по сравнению с предыдущей инфраструктурой. |
| Trainium4 (анонс) | Чип следующего поколения с совместимостью | Планируется совместимость с NVLink и сеткой Nvidia. |
| Nova + Nova Forge | Передовые модели + дополнительное обучение клиентов | Предварительное/частичное/последующее обучение + дообучение на данных компании. |
| Bedrock Reinforcement Fine-Tuning | Настройка модели на основе вознаграждения | Автоматизированный RFT рабочий процесс; AWS указывает на значительное улучшение точности. |
| AgentCore (Policy/Memory/Evals) | Управление агентами и наблюдаемость | Политики выполнения, эпизодическая память, 13 встроенных оценщиков. |
Сигналы клиентов и кейсы использования
Несколько клиентов продемонстрировали значительные преимущества от использования предложений AWS. Пример: Lyft использует Claude от Anthropic через Bedrock для агента, который сократил среднее время решения проблем водителей и пассажиров примерно на 87% и увеличил использование агента среди водителей — конкретный сигнал ROI для внедрения агентов в поддержку клиентов. AWS также подчеркнула развертывание на приватных данных через «AI Factories» для локальных или суверенных сред.
Комментарии редактора
Сообщения AWS на re:Invent 2025 объединяют три направления в единую корпоративную стратегию:
- агенты, способные действовать автономно,
- настройка моделей, уменьшающая зависимость от больших размеченных наборов данных,
- аппаратное обеспечение и ценовые меры, направленные на снижение TCO.
Комбинация логична: агентам нужна эффективная инференция и обучение моделей; предприятиям — безопасность и наблюдаемость; CIO хотят предсказуемые затраты.
FAQ
В: Что такое Reinforcement Fine-Tuning (RFT) в Bedrock?
О: RFT обучает модели с использованием функций вознаграждения, которые оценивают результаты, позволяя моделям оптимизировать желаемое поведение без огромных размеченных наборов данных; AWS предлагает управляемые RFT рабочие процессы.
В: Кто получает наибольшую выгоду от Trainium3?
О: Организации с большими нагрузками на обучение или частыми циклами переобучения моделей — облачные AI-команды и предприятия, использующие собственные LLM — получат наибольшую выгоду.
В: Изменения в AgentCore готовы для промышленной эксплуатации?
О: Policy, Memory и Evaluations в AgentCore ориентированы на корпоративное использование, но организациям рекомендуется проверять политики и пороги оценок на тестовой среде перед массовым внедрением.

