Перейти к содержимому
ТехнологииВажное

Microsoft представила чип Maia 200 — 10 PFLOPS AI‑инференса, в 3 раза быстрее конкурентов

Microsoft анонсировала новый ускоритель Maia 200 — более 100 млрд транзисторов, >10 petaflops в 4‑bit и ≈5 petaflops в 8‑bit, что в три раза превышает показатели конкурентов.

Сигнал: Для компаний, где расходы на инференс уже составляют до 30 % ИИ‑бюджета, внедрение Maia 200 позволяет снизить затраты на вычисления до 20 % уже в текущем квартале.

Microsoft запустила Maia 200, вторую версию чипа‑рабочей лошади для AI‑инференса, 12 марта. Устройство содержит более 100 млрд транзисторов и даёт >10 petaflops в 4‑bit и ≈5 petaflops в 8‑bit, что заметно опережает предшественника Maia 100.

Что произошло

В пресс‑релизе Microsoft сообщила, что один узел Maia 200 «без труда» обслуживает крупнейшие модели и оставляет запас мощности для будущих разработок. Чип уже работает в проектах Superintelligence и в сервисе Copilot, а SDK доступен разработчикам, учёным и ведущим AI‑лабораториям.

Почему это важно

Сейчас инференс‑расходы достигают до 30 % ИИ‑бюджета компаний; собственный чип снижает зависимость от Nvidia и позволяет конкурировать с Google TPU и Amazon Trainium. Microsoft заявила, что Maia 200 даёт в три раза больше FP4‑производительности, чем третье поколение Trainium, и превосходит FP8‑производительность седьмого поколения TPU.

Эта технология укрепляет позицию Microsoft в облачных AI‑услугах и помогает клиентам экономить на вычислительных ресурсах.

Все материалы