Перейти к содержимому
ТехнологииВажное

Новая модель Gemini Pro от Google установила рекордные результаты тестов — снова

Google представила Gemini 3.1 Pro — последнюю версию своего крупномасштабного LLM, сейчас доступную в виде превью и скоро в полном релизе. По независимым бенчмаркам, включая Humanity’s Last Exam, модель превзошла Gemini 3 и заняла первое место в рейтинге APEX‑Agents.

Signal: рост возможностей LLM для агентных и многошаговых задач усиливает конкуренцию между Google, OpenAI и Anthropic, указывая на ускоренное развитие AI‑технологий.

Google выпустил Gemini 3.1 Pro, новую итерацию своего языкового моделирования, доступную в режиме превью; полный релиз планируется в ближайшее время. Компания сообщила, что модель показывает рост производительности по сравнению с Gemini 3, выпущенным в ноябре.

Что показали бенчмарки

Независимые тесты, в том числе Humanity’s Last Exam, подтвердили улучшения: Gemini 3.1 Pro обогнал предшественника и занял первое место в системе оценки APEX, разработанной Brendan Foody из Mercor. Foody написал в соцсетях, что модель теперь «на вершине листа APEX‑Agents».

Контекст и значение

Запуск модели пришёлся на период усиления конкуренции в области LLM: ведущие игроки — OpenAI, Anthropic и другие — расширяют возможности систем для агентных приложений и многошагового вывода. Сильные результаты Gemini 3.1 Pro укрепляют позицию Google в этом сегменте и отражают тенденцию к ускоренному развитию «умных» ИИ‑моделей.

Все материалы