Для этого ученые использовали методику n-грамм. Программа находит словосочетания с заданным словом (n) и изучает, как применять то или иное слово в синтаксисе предложения. Алгоритм проанализировал порядка 4000 выступления политиков с 53 дебатов в Конгрессе США. Всего искусственный интеллект обработал 50 000 предложений в среднем по 23 слова каждое. Они были поделены на речи представителей демократической или республиканской партии, а также было обозначено, за или против той или иной темы выступает политик.
Затем алгоритму требовалось составить речь для определенной партии.
Результаты оказались даже лучше, чем ожидали ученые. Особенно хорошо алгоритм справился с грамматикой и переходом от одного предложения к другому. Однако у этой программы крайне ограниченный спектр применения. Едва ли она когда-то будет использоваться для написания политических речей, но вполне может справиться с рерайтингом или написанием текстов на основе других текстов. Код алгоритма находится в открытом доступе, поэтому экспериментировать с его применением может каждый.