Google представила нейросеть, генерирующую музыку по текстовому описанию
Google анонсировала MusicLM — это новейший генеративный искусственный интеллект, который может превращать текстовые описания различной сложности в качественную музыку.
Разработчики отмечают, что модели преобразования текста в музыку не новы, но MusicLM превосходит предыдущие системы как по качеству звука, так и по соблюдению текстового описания.
Нейросеть обучили на 280 тысячах часах музыки, чтобы она могла справляться со сложными запросами. Все мелодии создаются на частоте 24 кГц, которая остаётся неизменной в течение пары минут.
В приведённых примерах на сайте Google представлены 30-секундные фрагменты, сгенерированные буквально по паре предложений.
MusicLM способна генерировать музыку различных жанров и даже воспроизводить «уровень музыкального опыта» (например, начинающий или профессионал). В будущем Google может заняться созданием текстов песен, улучшением качества вокала и повышением частоты дискретизации.
Пока выкладывать MusicLM в открытый доступ разработчики не планируют.
Ответить
Want to join the discussion?Feel free to contribute!