⚡ Новый проект OpenAI: Sora превращает текст в видео
OpenAI представляет Sora - новая text-2-video модель, которая может создавать реалистичные и фантазийные видеосцены, основываясь на текстовых указаниях. Этот проект открывает новые возможности для визуализации идеи, перенося текст в движущиеся изображения без необходимости вручную редактировать видео.
Sora умеет генерировать видео длительностью до минуты, обеспечивая высокое визуальное качество и точное следование указаниям пользователя. Модель научена понимать физический мир в движении, что позволяет создавать видео, помогающие решать задачи с реальным взаимодействием.
Доступ к Sora уже предоставлен командам специалистов для оценки возможных рисков и вреда, а также визуальным художникам, дизайнерам и кинорежиссерам для сбора обратной связи и дальнейшего улучшения модели.
Выглядит невероятно! Пример сгенерированного видео про промпту “Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.”
UPD:
Если вы думаете, что Sora от OpenAI - это просто творческая игрушка, похожая на DALLE, подумайте еще раз. Sora - это движок, основанный на данных, который является симуляцией множества миров, будь то реальные или фантастические. Симулятор осваивает сложный рендеринг, "интуитивную" физику, рассуждения с широким горизонтом и семантическую привязку, всё это благодаря определённым методам удаления шума и математике градиентов.
Не удивлюсь, если Sora обучалась на большом количестве синтетических данных с использованием Unreal Engine 5.
Больше подробностей и примеров по ссылке ниже.
🔗 Link: https://openai.com/sora
#ai #gpt #llm #text2video #3d