Google представила нейросеть, генерирующую музыку по текстовому описанию

Она легко справится с созданием мелодий для аркадных игр, фонограммы и различных презентаций.

Google анонсировала MusicLM — это новейший генеративный искусственный интеллект, который может превращать текстовые описания различной сложности в качественную музыку.

Разработчики отмечают, что модели преобразования текста в музыку не новы, но MusicLM превосходит предыдущие системы как по качеству звука, так и по соблюдению текстового описания.

Нейросеть обучили на 280 тысячах часах музыки, чтобы она могла справляться со сложными запросами. Все мелодии создаются на частоте 24 кГц, которая остаётся неизменной в течение пары минут.

В приведённых примерах на сайте Google представлены 30-секундные фрагменты, сгенерированные буквально по паре предложений.

MusicLM способна генерировать музыку различных жанров и даже воспроизводить «уровень музыкального опыта» (например, начинающий или профессионал). В будущем Google может заняться созданием текстов песен, улучшением качества вокала и повышением частоты дискретизации.

Пока выкладывать MusicLM в открытый доступ разработчики не планируют.