Перейти к содержимому
Технологии

Руководитель Google Cloud AI о трёх границах возможностей моделей

В интервью Майкл Герстенхабер, вице‑президент продукта в Google Cloud, назвал три ограничивающих фактора: уровень интеллекта, задержка отклика и стоимость масштабирования.

Он сказал, что компании используют Vertex AI для создания агентных решений, но сталкиваются с отсутствием инфраструктуры аудита и авторизации, что замедляет внедрение.

Сигнал: растущий акцент на баланс между качеством модели и её экономической доступностью будет определять стратегии крупных игроков в сфере ИИ в ближайшие годы.

В роли руководителя Vertex AI Майкл Герстенхабер следит за тем, как корпоративные клиенты используют агентные модели. По его словам, модели сталкиваются с тремя одновременно действующими границами: уровень интеллекта (например, генерация кода), время отклика (важно в поддержке клиентов) и стоимость масштабирования (ключевая для платформ, модирующих большой поток контента). Классификация помогает компаниям выбирать компромисс между точностью и экономичностью.

Что происходит

Герстенхабер отметил, что Google контролирует всю цепочку — от дата‑центров и чипов до API‑интерфейсов памяти и кода. Эта инфраструктура даёт клиентам доступ к моделям Gemini Pro и Gemini Enterprise, но им остаётся разрабатывать собственные приложения. По его словам, такие компании, как Shopify и Thomson Reuters, уже используют платформу для построения агентных сервисов.

Почему это важно

  • Отсутствие стандартизированных решений для аудита и авторизации агентных действий замедляет внедрение в секторах, где нужен строгий контроль (банки, медицина).
  • Экономическая доступность модели становится решающим фактором при обработке огромного количества запросов, например, в модерации контента соцсетей.
  • Баланс между интеллектом и задержкой отклика критичен для клиент‑ориентированных сервисов, где длительное ожидание приводит к потере пользователя.

Что дальше

Герстенхабер predicts, что в ближайшие 12–18 месяцев появятся новые шаблоны «человек‑в‑цикл», позволяющие безопасно расширять агентные возможности на новые профессиональные области, а также инструменты для аудита и контроля, ускоряющие переход от прототипов к массовому производству.

Все материалы