В течение нескольких лет берлинский стартап EyeEm, разработчик платформы для фотографов EyeEm Vision, пытается уловить и расшифровать эстетическое значение фотографий. Его модель распознавания изображений позволяет на основании нескольких образцов вывести закономерность, понятную машине.

Это значит, что платформа Vision может подобрать варианты фотографий, визуально схожих с образцом, предоставленным пользователем. На видео показан пример работы с этим инструментом (скорость в 4 раза выше реальной).

Недавно команда EyeEm приняла участие в соревновании технологий распознавания изображений, выступив против главных игроков на этом поле, и результаты оказались впечатляющими: ИИ стартапа обогнал алгоритмы Google, IBM, Clarifai, Amazon и Microsoft. Для того, чтобы обеспечить чистоту эксперимента, алгоритмы этих компаний были запущены на 200 свежих фотографиях пяти наиболее плодовитых аккаунтов в Instagram. Эти фотографии ни одна из систем раньше не видела и не обучалась на них. Ключевые слова-характеристики фото, выданные алгоритмами, оценивались анонимно, при помощи краудсорсинговой платформы MTurk. Первое место занял EyeEm. В среднем, 80% ключевых слов, которые платформа генерировала на основании одной фотографии, совпадали с мнением людей. Результат Google — 78%, Clarifai — 73%.

EyeEm лучше всех справился с категориями «города», «люди/спорт», «природа» и «животные» (везде 83%). Единственная категория изображений, в которой немецкий алгоритм не преуспел, — «не фото», включающая рисунки, скриншоты и коллажи — то есть то, чему эту систему попросту не обучали. Единственная причина, по которой немецкий стартап смог побить, например, Google, заключается в том, что у EyeEm имеется сообщество из 20 миллионов фотографов, более миллиона из которых и занимается обучением платформы. На стороне чисто автоматизированного алгоритма Google человеческого фактора нет, пишет TechCrunch.

Илон Маск создаст нейронное кружево до 2027 года

Идеи

Обошла Google в технологии распознавания лиц и российская компания «VOCORD», разработавшая самый точный алгоритм идентификации лиц в мире. Осенью прошлого года ее алгоритм DeepVo1 показал максимальный процент точности среди всех существующих на сегодняшний день алгоритмов — 75,127%.

ИИ EyeEm Vision распознает фото лучше, чем алгоритмы Google или IBM