22 декабря 2018

ИИ хотели научить писать сюжеты к рождественским фильмам. Они получились грустными

Исследователи использовали сюжеты 360 фильмов для того, чтобы обучить искусственный интеллект писать сценарии, но затем обнаружили, что научить его шутить и быть смешным сложно.

Алгоритм, который использовали исследователи из MIT, называется textgenrnn. Он имеет два режима: ученые могут использовать буквы для генерации слов в стиле других слов или использовать слова для генерации предложений в стиле других предложений.

Каждый режим поставляется с одинаковыми настройками, которые вы можете изменить, чтобы добиться хороших результатов. В этом случае исследователи сосредоточились на трех показателях — количестве слоев, времени и креативности.

Слои относятся к сложности нейронной сети: чем больше у нее слоев, тем сложнее данные, с которыми она может работать. Количество времени — минуты, которые получает алгоритм, чтобы посмотреть на тренировочные данные, прежде чем выдать окончательные результаты. В случае низкой креативности сеть будет выбирать общие слова в наборе обучающих данных по сравнению с теми, которые появляются редко.

Среди синопсисов, которые предложил алгоритм, были такие: «Мужчина возвращается к певцу, который вынужден вернуть свою жизнь вместе с парой, чтобы помочь дочери на Рождество», «Одинокая курьерская деревенская газета на родине уничтожает Рождество, Рождество и Рождество», «Няня мальчик пытается праздновать Рождество в течение более Рождества». Названия фильмов же были «Рождественская миля», «IT-санта» и «Гранж-рождество».

Частично проблема связана с небольшим набором данных. 360 сюжетов — это слишком мало, обычно для тренировки нужны миллионы текстов. Также это связано с textgenrnn — алгоритм не очень хорош при построении предложений по сравнению с альтернативами. Она ограничена в генерировании предложений с помощью нейронной сети.