Исследователи из Microsoft попытались воспроизвести механизмы, которые есть и в поведении человека — реакцию на улыбки других людей. Во время обучения их алгоритм следил за лицом инженера и, если он улыбался, это давало знак, что ИИ верно интерпретировал данные. Кроме быстрого обучения ИИ, такой метод может стимулировать исследования, полезные для взаимодействия с эмоциями людей.
Как объяснили ученые, обучение, направленное на подкрепление знаний, обычно идет в связке с системой специальных вознаграждений, разработанных для достижения заранее определенной цели. Проблема заключается в том, что эти вознаграждения имеют узкую сферу охвата и некоторые ИИ могут неправильно их понять.
Используя систему компьютерного зрения, которая активирует вознаграждение, и другую систему, которая использует данные для решения множества задач, модель определяет улыбки и определяет позитивные и негативные реакции на действия алгоритма.
Результаты дальнейших экспериментов показали, что этот метод улучшил скорость и качество обучения. Новая модель от Microsoft cмогла ускориться на 46% и совершала ошибки на 29% реже.