Лаборатория DeepSeek выпустила два превью‑варианта новой крупной языковой модели DeepSeek V4: V4 Flash и V4 Pro. Обе версии построены как mixture‑of‑experts и имеют контекстный размер в 1 млн токенов, что упрощает работу с большими кодовыми базами и документами. V4 Pro содержит 1,6 трлн параметров (из них 49 млрд активных) — это крупнейшая открытая модель, обгоняющая Kimi K 2.6 (1,1 трлн) и M1 (456 млрд). V4 Flash имеет 284 млрд параметров (13 млрд активных).
Эффективность и результаты
DeepSeek сообщает, что обе версии превзошли предшественницу DeepSeek V3.2 по скорости и качеству благодаря архитектурным улучшениям. На бенчмарках рассуждений модели почти догнали лидеров рынка, а V4‑Pro‑Max обошёл открытых конкурентов и некоторые задачи у GPT‑5.2 и Gemini 3.0 Pro. В тестах кодинга их показатели сравнимы с GPT‑5.4, однако в тестах знаний они отстают от GPT‑5.4 и Gemini 3.1 Pro на 3–6 мес.
Стоимость и ограничения
Модели работают только с текстом, в отличие от закрытых конкурентов, которые поддерживают мультимодальность. При этом цены заметно ниже: V4 Flash стоит $0.14 за млн входных и $0.28 за млн выходных токенов; V4 Pro — $0.145 за вход и $3.48 за выход, что делает их самыми доступными среди современных LLM.