Автор протестировал более дюжины программ, преобразующих речь в текст, и оценил их по точности, удобству настройки и цене. Большинство решений используют LLM для лучшего понимания контекста и автоматической правки, а также предлагают удаление «слов‑показал», автопунктуацию и стилистические режимы.
Что произошло
В топе оказались Wispr Flow (многоязычная поддержка, до 2 000 слов в неделю бесплатно), Willow (генерация текста из короткой диктовки, локальное хранение данных) и Monologue (полностью офлайн‑модель, бесплатный лимит 1 000 слов в месяц). Другие продукты — Superwhisper, VoiceTypr, Aqua, Handy, Typeless, VoiceInk, Dictato и AudioPen — предлагают тарифы от бесплатных до пожизненных лицензий и открытый код.
Почему это важно
Развитие LLM и систем распознавания речи существенно сократило число ошибок и потребность в пост‑редактировании. Пользователи могут выбирать облачные или полностью локальные решения, контролируя конфиденциальность данных. Стоимость варьируется от бесплатных планов до подписок $8‑$15 в месяц и единовременных лицензий до $98, что делает технологии доступными для разных категорий пользователей.
Что дальше
Ожидается более тесная интеграция AI‑диктовки в рабочие процессы: персонализация стилей, автоматическое распознавание кода и расширение списка поддерживаемых языков. Конкуренция будет смещаться в сторону приватности и гибкости, делая диктовку полноценной альтернативой набору текста.