Midjourney теперь поддерживает команду /describe которая работает в обратном направлении, вы загружаете изображение, она генерирует вам prompt.
Для чего это нужно?
1) Как функция “перепиши текст”, только в формате “перерисуй”. Загружаете изображение, получаете prompt, меняете его, если необходимо - получаете обновленное изображение
2) Чтобы добавить мультимодальности в ваши сетки, пока мультимодальные сети аля GPT-4 еще недоступны. Хотите, чтобы лингвистическая модель работала с загруженным изображением? Опишите его через /describe, а дальше используйте описание изображения как часть промпта. Это уже даст прирост в 80% относительно “голых” сеток, которые работают только с текстом.
P.S. На изображении видим путь исходное изображение → prompt → сгенерированное изображение.
