После анонса Andy Jassy о $50 млрд. инвестициях AWS в OpenAI компания пригласила меня в закрытую лабораторию, где разрабатываются чипы Trainium. На текущий момент в эксплуатации находятся 1,4 млн чипов трёх поколений, более 1 млн из них используют в системе Anthropic Claude. Amazon согласовал предоставление 2 ГВт вычислительной мощности Trainium для новых AI‑агентов OpenAI.
Что произошло
Лаборатория в районе Austin «The Domain» демонстрирует новые модели Trainium3 и серверы Trn3 Ultra. Они используют сетевые переключатели Neuron для полной меш‑связи чипов, что уменьшает задержки. Директор лаборатории Kristopher King отметил, что такие решения могут снизить цены на 50 % при той же производительности, что и традиционные GPU‑серверы.
Почему это важно
Изначально Trainium разрабатывали для обучения моделей, но теперь чипы тоже применяются для инференса — основной узкой зоны в индустрии AI. Поддержка PyTorch и возможность перейти к нему «одной строкой кода» упрощают замену решений Nvidia. Партнёрство с Cerebras Systems расширяет возможности низкозатратного, низколатентного инференса.
Что дальше
Amazon планирует интегрировать Trainium в сервис Bedrock, который может достичь масштабов EC2. При росте спроса на AI‑приложения чипы Trainium способны значительно сократить зависимость отрасли от Nvidia и изменить баланс сил на рынке процессоров для искусственного интеллекта.