ТехнологииВажное

DeepSeek анонсирует новую ИИ‑модель, сокращающую разрыв с лидерами

Китайская лаборатория DeepSeek представила две предварительные версии крупной открытой модели DeepSeek V4: V4 Flash (284 млрд параметров) и V4 Pro (1,6 трлн параметров, из них 49 млрд активных). Обе модели работают по принципу mixture‑of‑experts и поддерживают контекстный объём в 1 млн токенов, что снижает затраты на вывод.

DeepSeek сообщает, что цена за обработку токенов составляет $0.14–$0.145 за млн входных токенов, делая V4 самой доступной открытой LLM‑моделью. Это усиливает конкуренцию открытого сегмента против закрытых лидеров, таких как GPT‑5.4 и Gemini 3.1.

Сигнал: масштаб и цена модели позволяют DeepSeek V4 конкурировать с крупнейшими закрытыми системами.

24 апреля 2026 г.

Лаборатория DeepSeek выпустила два превью‑варианта новой крупной языковой модели DeepSeek V4: V4 Flash и V4 Pro. Обе версии построены как mixture‑of‑experts и имеют контекстный размер в 1 млн токенов, что упрощает работу с большими кодовыми базами и документами. V4 Pro содержит 1,6 трлн параметров (из них 49 млрд активных) — это крупнейшая открытая модель, обгоняющая Kimi K 2.6 (1,1 трлн) и M1 (456 млрд). V4 Flash имеет 284 млрд параметров (13 млрд активных).

Эффективность и результаты

DeepSeek сообщает, что обе версии превзошли предшественницу DeepSeek V3.2 по скорости и качеству благодаря архитектурным улучшениям. На бенчмарках рассуждений модели почти догнали лидеров рынка, а V4‑Pro‑Max обошёл открытых конкурентов и некоторые задачи у GPT‑5.2 и Gemini 3.0 Pro. В тестах кодинга их показатели сравнимы с GPT‑5.4, однако в тестах знаний они отстают от GPT‑5.4 и Gemini 3.1 Pro на 3–6 мес.

Стоимость и ограничения

Модели работают только с текстом, в отличие от закрытых конкурентов, которые поддерживают мультимодальность. При этом цены заметно ниже: V4 Flash стоит $0.14 за млн входных и $0.28 за млн выходных токенов; V4 Pro — $0.145 за вход и $3.48 за выход, что делает их самыми доступными среди современных LLM.

Все материалы

Дайджест каждый день

Краткая выжимка ключевых событий — прямо на почту. Без спама, только самое важное.