OpenAI запустила API Responses, набор инструментов, разработанный для помощи разработчикам и бизнесу в создании агентов искусственного интеллекта — автоматизированных систем, способных самостоятельно выполнять задачи, такие как поиск в Интернете, извлечение файлов и онлайн-навигацию.
Это новое предложение заменяет API Assistants, которое будет постепенно прекращаться к середине 2026 года. Вместе с открытым набором инструментов под названием Agents SDK, OpenAI стремится улучшить надежность и масштабируемость автоматизации, основанной на искусственном интеллекте.
Возможности API Responses
Поиск и извлечение информации с использованием искусственного интеллекта
API Responses интегрирует поисковые инструменты GPT-4o search и GPT-4o mini search от OpenAI, которые являются основой для инструментов поиска ChatGPT. Эти модели позволяют агентам искусственного интеллекта просматривать Интернет в поисках ответов и генерировать ответы с ссылками, обладая точностью в 90% и 88% соответственно по результатам простого подхода к вопросам и ответам от OpenAI (SimpleQA benchmark), что превосходит недавно выпущенную модель GPT-4.5 с показателем в 63%.
Кроме того, API предлагает инструмент поиска по файлам, позволяющий предприятиям сканировать документы и извлекать актуальную информацию без использования OpenAI данных для обучения моделей.
Автоматизация задач с использованием технологии Operator от OpenAI
Разработчики, использующие API Responses, могут получить доступ к модели Computer-Using Agent (CUA) от OpenAI, которая генерирует действия мыши и клавиатуры для автоматизации задач, таких как ввод данных и работа с веб-интерфейсами.
Хотя эта возможность в настоящее время доступна в продукте Operator от OpenAI для задач на основе веб-интерфейсов, предприятия могут развернуть модель локально для повышения безопасности и контроля.
Преодоление вызовов, связанных с агентами искусственного интеллекта
Дилемма точности и галлюцинаций искусственного интеллекта
Несмотря на улучшения, в результате которых поисковые результаты, сгенерированные искусственным интеллектом, не являются безошибочными, поиск GPT-4o допускает 10% ошибок в отношении фактических запросов и надежность используемых ссылок вызывает сомнения.
Более того, агенты искусственного интеллекта испытывают трудности с короткими навигационными запросами, такими как спортивные счеты или обновления акций, что указывает на то, что остаются трудности в повышении эффективности поиска с помощью искусственного интеллекта.
Ошибки и вопросы надежности в автоматизации задач с использованием искусственного интеллекта
OpenAI признает, что CUA пока еще не является очень надежным инструментом для управления задачами в операционных системах и признает, что агенты искусственного интеллекта все еще допускают нежелательные ошибки.
Эти вопросы подчеркивают необходимость постоянного контроля со стороны человека и инструментов для поиска ошибок, которые OpenAI стремится смягчить с помощью Agents SDK, набора утилит для мониторинга поведения модели и оптимизации ее работы.
Будущее агентов искусственного интеллекта и видение OpenAI
2025 год: наступление агентов искусственного интеллекта на рабочий рынок?
OpenAI позиционирует агентов искусственного интеллекта как новую границу в области автоматизации, API-продукт-менеджер Оливье Годеман описывает их как "наиболее значимое применение искусственного интеллекта". Генеральный директор Сэм Олтмен выражает аналогичную точку зрения, предсказывая, что 2025 год может стать годом, когда агенты искусственного интеллекта станут основным средством ведения бизнеса.
В то время как OpenAI делает значительные шаги в области автоматизации с помощью искусственного интеллекта, реальное принятие агентов искусственного интеллекта в мире зависит от преодоления технических недостатков и предоставления практичных масштабируемых приложений. В случае успеха последние инструменты OpenAI могут привести к преобразованию предприятий с помощью искусственного интеллекта.
Комментарии редакции
В широкоформатной индустрии искусственного интеллекта по-прежнему остаются вызовы в том, чтобы превратить впечатляющие демонстрации в надежные продукты. С учетом того, что конкурирующие фирмы также работают над разработкой интеллектуальной автоматизации, в 2025 году может наблюдаться всплеск принятия агентов искусственного интеллекта — если разработчики смогут превратить инструменты OpenAI в поистине значимые приложения с минимизацией ошибок. Предстоящие месяцы будут решающими для определения того, приведут ли агенты искусственного интеллекта к революции в мировой трудовой деятельности или останутся переоцененной концепцией.