Ученые использовали 190 165 различных музыкальных сегментов из более чем 5 300 эстрадных песен в качестве обучающих данных для этой системы. Используя только тексты песен или только аккорды, они обучили ИИ определять тот или иной жанр.
Система определила, что Old Town Road — песня американского хип-хоп-исполнителя Lil Nas X — это фолк, если опираться только на текст, рок — благодаря гитарным аккордам и поп, если оценивать музыку в целом. Исследователи считают, что смешение разных жанров повлияло на популярность песни. Она несколько недель не покидала чарт Billboard Hot 100 и побила рекорд по продолжительности нахождения на первом месте — 19 недель.
Тимоти Грир, один из разработчиков ИИ, отмечает, что большинство подобных инструментов прогнозирования полагаются на полный аудиофайл песни, который требует поиска и обработки высококачественной записи. Инструмент Грира может определять жанр только через аккорды и тексты песен. Поскольку и то, и другое легко найти в интернете, идентификация становится гораздо проще.
«Мы всегда говорим, что не существует жестких правил для восприятия музыки человеком. Иногда мы не понимаем, почему та или иная песня — это хит, — отметил ученый Шрикант Нараянан. — ИИ и машинное обучение могут дать объектив, с помощью которого можно взглянуть на этот самый человеческий опыт со стороны».