Алгоритм команды CSAIL отличается от принятого метода анализа пикселев. Он предсказывает «визуальные образы», то есть застывшие кадры, показывающие, каким может быть дальнейшее развитие событий. Эта технология основана на глубоком обучении, использующем нейронные сети для передачи компьютеру огромного массива информации, на основании которой он самостоятельно делает выводы.
После просмотра 600 часов видео, компьютер смог предсказать один из вариантов развития сюжета (рукопожатие, объятия, поцелуй или «дай пять») за 1 секунду до воплощения в 43% случаев, по сравнению с другими алгоритмами, наилучший результат которых — 36%.
Алгоритм от DeepMind самостоятельно научился играть в футбол
Идеи
Во втором случае алгоритм должен был угадать, какой предмет появится в сцене. Например, если кто-то открывает микроволновку, то, скорее всего, достанет оттуда чашку с кофе. Система МТИ справилась с задачей на 30% лучше, чем другие, хотя общий уровень точности составляет пока всего 11%.
Следует упомянуть, что люди тоже ошибаются в таких случаях — процент верных предсказаний составляет у нас 71%.
Хотя алгоритм еще не готов для практического применения, будущие версии могут быть использованы для всего, от роботов, которые продумывают план действий, до камер слежения, которые отсылают сигнал в службу спасения, если кто-то упал или получил травму, пишет MIT News.