В понедельник компания Thinking Machines Lab представила предварительный обзор interaction models — концепцию, в которой ИИ не просто слушает, а одновременно обрабатывает запрос и формирует ответ, как в телефонном разговоре.
Что произошло
В основе лежит принцип «full duplex»: модель TML-Interaction-Small отвечает за 0,40 секунды, что почти вдвое быстрее типичных текстовых чат‑ботов и приближено к скорости человеческой речи. Это исследовательская версия, доступная пока ограниченному кругу исследователей, с планами широкой публичной релиз к концу года.
Почему это важно
Текущие генеративные модели работают по принципу «говори‑после‑послушай», что приводит к задержкам и менее естественному ощущению диалога. Дуплексный подход может сократить время отклика, улучшить плавность общения и открыть новые сценарии, где нужен быстрый обмен репликами, например, в голосовых ассистентах или интерактивных обучающих системах.
Что дальше
Пока проект находится в стадии исследования, реальная эффективность будет оцениваться только после публичного тестирования. Если заявленные показатели подтвердятся, это может задать новый стандарт для интерактивных ИИ‑систем.