Хотя мозг человека хорошо распознает изображения, он в этом не идеален. Если рисунок чуточку изменить, человек не всегда сможет правильно определить, что там изображено, пишет MIT Technology Review.
Взять, к примеру, фотографию машины. Если она будет снята с двух разных ракурсов, сможет ли зритель уверенно заявить, что это одна и та же машина? И будут ли такие же сложности у компьютера?
Для этого профессор Херадпишех и его команда провели эксперимент с четырьмя разными объектами. Человеку показывали случайное изображение в течение 12,5 микросекунд, и он должен был нажать одну из четырех кнопок — машина, корабль, мотоцикл или животное.
Google запускает новую платформу машинного обучения
Технологии
Аналогичный тест был проведен и с двумя наиболее мощными сетями глубокого обучения, в Университете Торонто и в Оксфорде.
В результате оказалось, что люди и машины в основном испытывали схожие сложности в каждом из заданий.
Выводы, которые сделали ученые, таковы: во-первых, создателям нейронных сетей надо быть внимательнее при формировании баз данных для испытания машинного зрения. И больше концентрироваться на сложных для компьютера случаях.
Новый уровень глубокого обучения для роботов
Идеи
Во-вторых, у нейронных сетей есть возможность перенять принцип работы человеческого сознания. Например, в создании определенного рода изображений — знаков дорожного движения или инструкций по мерам безопасности. У человека на оценку таких изображений уйдет много времени, а компьютер мог бы быстро отобрать наилучшие варианты.
В-третьих, можно было бы создать систему машинного зрения, которая не ошибалась бы так, как человек, повысив, таким образом, способность принимать решения в критических ситуациях, например, во время управления транспортным средством.