Multiverse Computing выпустила приложение CompactifAI и открытый API‑портал, чтобы разработчики и предприятия могли работать с сжатыми моделями ИИ без обращения к облачным провайдерам. Технология CompactifAI использует модель Gilda, которая помещается в оперативную память смартфона и отвечает на запросы офлайн.
Что запущено
Приложение поддерживает чат‑интерфейс, похожий на ChatGPT. При нехватке RAM оно переключается на облачные модели через систему Ash Nazg. API‑портал показывает мониторинг в реальном времени и предоставляет прямой доступ к сжатым версиям моделей от OpenAI, Meta, DeepSeek и Mistral AI. По данным Sensor Tower, за последний месяц приложение скачали менее 5 000 раз.
Преимущества сжатых моделей
Сжатые модели снижают затраты на вычисления и позволяют внедрять ИИ в устройства с ограниченным подключением — дроны, спутники, медицинское оборудование. Последний компрессированный вариант HyperNova 60B 2602, построенный на открытом коде gpt-oss-120b, отвечает быстрее и работает дешевле, чем исходный крупный LLM.
Перспективы
Компания обслуживает более 100 клиентов, среди которых Bank of Canada, Bosch и Iberdrola. После привлечения $215 млн в раунде Series B в прошлом году, она планирует новый раунд в €500 млн при оценке более €1,5 млрд, что ускорит масштабирование технологии.