OpenAI анонсировала Images 2.0 — обновлённую модель, способную точно воспроизводить мелкий текст, UI‑элементы и сложные композиции. В отличие от прежних диффузионных систем, которые часто искажали надписи, новая технология использует авторегрессивный подход, аналогичный работе больших языковых моделей.
Что произошло
Модель умеет искать в вебе, создавать несколько изображений по одному запросу и автоматически проверять результат. Пользователи ChatGPT получат возможность быстро генерировать маркетинговые материалы, меню ресторанов и даже многокадровые комиксы. Доступ к Images 2.0 откроют всем пользователям во вторник; платные клиенты получат расширенные опции и API gpt-image-2 с ценой, зависящей от качества и разрешения.
Почему это важно
- Лучшее восприятие нелатинских скриптов: японского, корейского, хинди и бенгали.
- Поддержка разрешения до 2 K и детализированных элементов расширяет применение в дизайне, рекламе и прототипировании UI.
- Переход от диффузионных к авторегрессивным моделям повышает точность и надёжность генерации текста в изображениях.
Что дальше
OpenAI планирует дальше развивать Images 2.0, улучшать интеграцию с другими сервисами и расширять доступность через платные тарифы и API, ускоряя внедрение ИИ‑генерации в коммерческие рабочие процессы.