Baidu, китайский поисковый гигант, выиграл конкурс ActivityNet в конце августа 2017 года и создал ИИ, который смог распознать действия на 300 000 видеороликах YouTube (от альпинизма до цветочного оформления) со средней точностью 87,6%, сообщает Datanami.
Конкурс ActivityNet был объявлен для оценки способности ИИ к переходу от распознавания неподвижных изображений к распознаванию действий, содержащихся в 10-секундных видеороликах. Распознавание лиц на неподвижных изображениях и уже используют в различных сферах. Baidu запускает программу, где эта технология используется вместо билетов на мероприятия. Программа знает кто вы, из загруженного вами изображения или вашего профиля в социальных сетях, видит ваше лицо, когда вы появляетесь, и знает, разрешено ли вам войти. Франция испытала распознавание лиц в аэропорту Шарль-де-Голль, в этом году, а в 2016 подобная программа была испытана в Японии.
ИИ Baidu Research основан на структуре пространственно-временного моделирования, в котором видеоданные использовались для обучения нейронной сети для извлечения видеообъектов, таких как цвет и звук. Затем эти функции были загружены в четыре временных модели для классификации видео.
Растущая конкуренция за разработку алгоритмов классификации видео отражает стремительный рост рынка видеоаналитики, поскольку видеокамеры высокой четкости становятся повсеместными и объем видеоданных растет очень быстро. Отраслевые эксперты отмечают, что видео является самым быстрорастущим по объему типом данных в Интернете.
«Дни двигателя внутреннего сгорания сочтены»
Мнения
Полиция штата Нью-Йорк нашла виновных в более чем 20 тысячах преступлений с 2010 года благодаря системе распознавания лиц. Продвинутая технология защищает жителей от водителей-лихачей, мошенников и похитителей личных данных.