Перейти к содержимому
ТехнологииВажное

Новый набор моделей ИИ от индийской лаборатории Sarvam — ставка на открытый искусственный интеллект

Индийская лаборатория Sarvam представила две новые большие языковые модели — 30 млрд и 105 млрд параметров, а также модели для преобразования речи и визуального анализа документов. Модели построены на архитектуре mixture‑of‑experts, что позволяет активировать лишь часть параметров и существенно снизить вычислительные расходы; они обучены с нуля на триллионах токенов, включая множество индийских языков.

Signal: Запуск открытых больших моделей от Sarvam подтверждает растущий интерес к эффективным альтернативам западным и китайским AI‑гигантам и усиливает тенденцию локализации ИИ‑технологий в развивающихся рынках.

На India AI Impact Summit в Нью‑Дели компания Sarvam объявила о выпуске новой линейки ИИ‑моделей, включающей 30‑млрд‑ и 105‑млрд‑параметров модели, а также решения для преобразования текста в речь, речи в текст и анализа визуального контента. Архитектура mixture‑of‑experts позволяет использовать лишь часть параметров в реальном времени — это снижает затраты на вычисления.

Что представлено

Модель 30B поддерживает контекстный размер в 32 000 токенов, а 105B — 128 000 токенов, что открывает возможности для сложных многократных рассуждений. Обе модели обучены с нуля: 30B — на ~16 трлн токенов, 105B — на триллионах токенов из разных индийских языков. Стартап планирует открыть исходный код 30B и 105B моделей, хотя детали публикации данных пока не раскрыты.

Значение

Разработка прошла при поддержке правительственной инициативы IndiaAI Mission, инфраструктурой от Yotta и технологической помощью Nvidia. За счёт более дешевого и локализованного подхода Sarvam стремится отнять часть рынка у дорогих американских и китайских решений, предлагая инструменты для голосовых ассистентов и чат‑ботов на индийских языках. Планы по созданию специализированных моделей для кода и корпоративных сервисов (продукт Sarvam for Work и платформа Samvaad) являются частью стратегии компании по расширению реального применения ИИ.

Все материалы