В роли руководителя Vertex AI Майкл Герстенхабер следит за тем, как корпоративные клиенты используют агентные модели. По его словам, модели сталкиваются с тремя одновременно действующими границами: уровень интеллекта (например, генерация кода), время отклика (важно в поддержке клиентов) и стоимость масштабирования (ключевая для платформ, модирующих большой поток контента). Классификация помогает компаниям выбирать компромисс между точностью и экономичностью.
Что происходит
Герстенхабер отметил, что Google контролирует всю цепочку — от дата‑центров и чипов до API‑интерфейсов памяти и кода. Эта инфраструктура даёт клиентам доступ к моделям Gemini Pro и Gemini Enterprise, но им остаётся разрабатывать собственные приложения. По его словам, такие компании, как Shopify и Thomson Reuters, уже используют платформу для построения агентных сервисов.
Почему это важно
- Отсутствие стандартизированных решений для аудита и авторизации агентных действий замедляет внедрение в секторах, где нужен строгий контроль (банки, медицина).
- Экономическая доступность модели становится решающим фактором при обработке огромного количества запросов, например, в модерации контента соцсетей.
- Баланс между интеллектом и задержкой отклика критичен для клиент‑ориентированных сервисов, где длительное ожидание приводит к потере пользователя.
Что дальше
Герстенхабер predicts, что в ближайшие 12–18 месяцев появятся новые шаблоны «человек‑в‑цикл», позволяющие безопасно расширять агентные возможности на новые профессиональные области, а также инструменты для аудита и контроля, ускоряющие переход от прототипов к массовому производству.