Технологии

OpenAI добавила новые голосовые функции в API

OpenAI объявила о запуске в API трёх голосовых моделей: GPT‑Realtime‑2 с качеством рассуждений уровня GPT‑5, сервис GPT‑Realtime‑Translate для перевода в реальном времени и модель GPT‑Realtime‑Whisper, которая расшифровывает речь.

Эти инструменты открывают возможности для аудио‑интерфейсов в поддержке клиентов, образовании и медиа.

Сигнал: расширение голосовых функций свидетельствует о растущем спросе на интерактивные аудио‑решения.

OpenAI представила три новых голосовые модели, доступные через Realtime API.

GPT‑Realtime‑2

Модель GPT‑Realtime‑2 поддерживает диалог, используя рассуждения, сравнимые с GPT‑5.

GPT‑Realtime‑Translate

Сервис GPT‑Realtime‑Translate переводит разговор в реальном времени, работает с более чем 70 входными языками и 13 целевыми.

GPT‑Realtime‑Whisper

Модель GPT‑Realtime‑Whisper превращает речь в текст по мере общения, обеспечивая стенографию в реальном времени.

За использование Translate и Whisper взимается плата за минуту, а за GPT‑Realtime‑2 — за потреблённые токены.

OpenAI ориентирует инструменты на компании, которые хотят улучшить обслуживание клиентов, а также на образование, медиа, мероприятия и платформы для создателей контента. Чтобы предотвратить злоупотребления, система ограничивает разговоры, нарушающие правила о вредоносном содержании.

Все материалы