Кейсы 16 февраля 2016

Алгоритм научился отличать добро от зла

Далее

Ученые из Технологического института Джорджии прививают искусственному интеллекту понятие этики, используя короткие рассказы. При этом программа Quixote получает награды за приверженность этическим идеалам и наказание за аморальный выбор.

Во главе исследования стоят ученые Марк Ридл и Брент Харрисон. В прошлом году Ридл представил проект Scheherezade — умный генератор сюжетных линий на основе краудсорсинга. Этот же алгоритм был использован для обучения Quixote эмпатии.

Scheherezade прокладывает структуру сюжетных элементов и выбирает наиболее «надежный» путь.

После этого в работу включается Quixote и превращает сюжетный граф в дерево с узлами (в данном случае — сюжетными коллизиями), которые связаны между собой различными событиями. Затем программа либо награждает, либо наказывает интеллектуального агента в зависимости от выбранного им развития событий. В основе этого метода лежит обучение методом проб и ошибок (reinforcement learning).

Georgia Institute of Technology

По мнению ученых, этот алгоритм идеально подходит именно для интеллектуальных агентов с ограниченным функционалом, которые должны взаимодействовать с людьми. Благодаря этому искусственный интеллект научится различать плохое и хорошее и будет внушать большее доверие людям.