Технологии

Thinking Machines хочет создать ИИ, который действительно слушает, пока говорит

AI‑стартап Thinking Machines Lab, основанный бывшим CTO OpenAI Миразой Мурати, анонсировал исследовательскую версию «interaction models», позволяющих модели отвечать одновременно с получением ввода.

Технология называется «full duplex»: модель TML-Interaction-Small генерирует ответ за 0,40 сек, что сопоставимо с темпом живого разговора и быстрее аналогов от OpenAI и Google.

Сигнал: если масштабировать, такие модели могут изменить пользовательский опыт чат‑ботов, превратив диалог в более естественное, «звонок‑подобное» взаимодействие.

12 мая 2026 г.

В понедельник компания Thinking Machines Lab представила предварительный обзор interaction models — концепцию, в которой ИИ не просто слушает, а одновременно обрабатывает запрос и формирует ответ, как в телефонном разговоре.

Что произошло

В основе лежит принцип «full duplex»: модель TML-Interaction-Small отвечает за 0,40 секунды, что почти вдвое быстрее типичных текстовых чат‑ботов и приближено к скорости человеческой речи. Это исследовательская версия, доступная пока ограниченному кругу исследователей, с планами широкой публичной релиз к концу года.

Почему это важно

Текущие генеративные модели работают по принципу «говори‑после‑послушай», что приводит к задержкам и менее естественному ощущению диалога. Дуплексный подход может сократить время отклика, улучшить плавность общения и открыть новые сценарии, где нужен быстрый обмен репликами, например, в голосовых ассистентах или интерактивных обучающих системах.

Что дальше

Пока проект находится в стадии исследования, реальная эффективность будет оцениваться только после публичного тестирования. Если заявленные показатели подтвердятся, это может задать новый стандарт для интерактивных ИИ‑систем.

Все материалы

Дайджест каждый день

Краткая выжимка ключевых событий — прямо на почту. Без спама, только самое важное.