Разработчики из университета Торонто создали нейросеть, которая умеет сочинять песни про предметы, показанные на фотографиях.
Об этом сообщил портал N+1 со ссылкой на The Guardian.
В режиме реального времени рекуррентная нейросеть создает мелодию и подбирает к ней слова.
С помощью базы данных, состоящей из 100 часов музыки, исследователи предварительно обучили программу сочинять простые мелодии с темпом 120 bpm (ударов в минуту). Причем искусственный интеллект учитывал типичные для поп-музыки последовательности аккордов, а также добавлял в композицию ударные.
Затем программа была обучена подбирать слова к своей мелодии. Для того, чтобы создать словарь для нейросети, ученые использовали 51 час аудиозаписей текстов песен (без музыки) и композицию Just Dance. Исследователи оставляли только те слова, которые встречались чаще четырех раз, поэтому словарный запас искусственного интеллекта оказался небольшим — всего 3390 слов. С их помощью он научился сочинять собственные поп-хиты и петь их со скоростью 1 удар на слово (1 beat per word).
Авторы работы также обучили нейросеть понимать, как определенные слова могут быть связаны с изображенными на снимках предметами.
Исследователи проверили работу нейросети, введя в нее снимок наряженной к Рождеству елки. В итоге компьютер создал довольно странную рождественскую песню.