rvachev.orgEN / RU / 🤖
← К эссе
· Эссе · 1 мин

ChatGPT Images 2.0: новое поколение генерации картинок

OpenAI выпустили ChatGPT Images 2.0 - новое поколение генерации картинок с улучшенной точностью и контролем.

🎨 OpenAI выпустили ChatGPT Images 2.0 - новое поколение генерации картинок.

Главное обновление - точность и контроль. Модель стала заметно лучше держать сложные сцены с множеством деталей, читаемой типографикой и реалистичной композицией. На примерах показывают постеры, развороты журналов, страницы манги, рукописные конспекты и инфографику - все с правильно сверстанным текстом, что раньше было слабым местом любых image-моделей.

Серьезный скачок и в фотореализме: кинематографичные портреты, ночные снимки на пленку со вспышкой, документальная street-фотография - все на уровне, где уже сложно отличить от настоящей камеры. Плюс работают со стилистическим диапазоном: фото, иллюстрация, манга, pixel art, комиксы с consistent персонажами через несколько панелей.

Самое интересное архитектурно - thinking mode для картинок. Модель теперь может ресерчить, рассуждать и подтягивать актуальную информацию из веба перед генерацией. То есть на запрос "сделай инфографику по последней статье X" или "нарисуй текущий мерч OpenAI" она сначала найдет данные, а потом сверстает визуал. Image gen перестает быть отдельным инструментом и становится продолжением reasoning-модели.

Подтянули и продакшн-готовность: гибкие соотношения сторон (от баннеров до вертикали под мобайл), character reference sheets с согласованными позами и эмоциями, print-ready макеты с разметкой bleed/trim/safe margins. Это уже не просто "красивая картинка", а готовый ассет для дизайнера или маркетолога.

Сильно подтянули и нелатинские скрипты: японский, арабский, корейский, деванагари, кириллица, бенгали, китайский. Можно делать готовые рекламные макеты на корейском или мангу на японском без артефактов в иероглифах.

https://openai.com/index/introducing-chatgpt-images-2-0/