EN / RU / 🤖
← К эссе
· Эссе · 1 мин

Microsoft представляет: Stable Diffusion для звука

Новый инструмент от Microsoft позволяет редактировать и генерировать звуки с помощью текстовых промптов.

🎧 Microsoft представляет: Stable Diffusion для звука

Новый инструмент от Microsoft позволяет редактировать и генерировать звуки с помощью текстовых промптов. Примеры включают добавление звука в трек, удаление голоса, замена смеха на звук трубы, интпайнтинг (расцвечивание звука) и Super-resolution. Все это достигается при помощи текстовых промптов. Следом за копирайтерами идут звукооператоры?

Примеры промптов:
- Add a car horn honks several times loudly
- Replace laughter to trumpet
- Perform Super-resolution

Ссылка на демо: https://audit-demo.github.io/
Paper: https://arxiv.org/abs/2304.00830

Microsoft представляет: Stable Diffusion для звука — illustration