Microsoft запустила Maia 200, вторую версию чипа‑рабочей лошади для AI‑инференса, 12 марта. Устройство содержит более 100 млрд транзисторов и даёт >10 petaflops в 4‑bit и ≈5 petaflops в 8‑bit, что заметно опережает предшественника Maia 100.
Что произошло
В пресс‑релизе Microsoft сообщила, что один узел Maia 200 «без труда» обслуживает крупнейшие модели и оставляет запас мощности для будущих разработок. Чип уже работает в проектах Superintelligence и в сервисе Copilot, а SDK доступен разработчикам, учёным и ведущим AI‑лабораториям.
Почему это важно
Сейчас инференс‑расходы достигают до 30 % ИИ‑бюджета компаний; собственный чип снижает зависимость от Nvidia и позволяет конкурировать с Google TPU и Amazon Trainium. Microsoft заявила, что Maia 200 даёт в три раза больше FP4‑производительности, чем третье поколение Trainium, и превосходит FP8‑производительность седьмого поколения TPU.
Эта технология укрепляет позицию Microsoft в облачных AI‑услугах и помогает клиентам экономить на вычислительных ресурсах.