На India AI Impact Summit в Нью‑Дели компания Sarvam объявила о выпуске новой линейки ИИ‑моделей, включающей 30‑млрд‑ и 105‑млрд‑параметров модели, а также решения для преобразования текста в речь, речи в текст и анализа визуального контента. Архитектура mixture‑of‑experts позволяет использовать лишь часть параметров в реальном времени — это снижает затраты на вычисления.
Что представлено
Модель 30B поддерживает контекстный размер в 32 000 токенов, а 105B — 128 000 токенов, что открывает возможности для сложных многократных рассуждений. Обе модели обучены с нуля: 30B — на ~16 трлн токенов, 105B — на триллионах токенов из разных индийских языков. Стартап планирует открыть исходный код 30B и 105B моделей, хотя детали публикации данных пока не раскрыты.
Значение
Разработка прошла при поддержке правительственной инициативы IndiaAI Mission, инфраструктурой от Yotta и технологической помощью Nvidia. За счёт более дешевого и локализованного подхода Sarvam стремится отнять часть рынка у дорогих американских и китайских решений, предлагая инструменты для голосовых ассистентов и чат‑ботов на индийских языках. Планы по созданию специализированных моделей для кода и корпоративных сервисов (продукт Sarvam for Work и платформа Samvaad) являются частью стратегии компании по расширению реального применения ИИ.