ИИ не смог понять комиксы

Мохит Ийер из Университета Мэриленда и его коллеги смогли дать обоснованный ответ на вопрос: "В чем искусственный интеллект еще не преуспел?". Оказывается, ИИ трудно дается чтение комиксов.

Ийер и его коллеги провели эксперимент: создали большую базу данных комиксов для обучения компьютера (за основу взяли золотой век этого жанра, с 1930-х по 1950-е гг.), 4000 книг, 1,2 млн отдельных изображений. Оцифровали весь текст.

Затем машине показывали последовательность картинок. Она должна была предсказать, что будет дальше, выбрав один вариант ответа. Например, узнать следующую картинку или текст или сопоставить текст с конкретным персонажем.

Результат был неожиданным: тогда как человек способен ответить на эти вопросы с 80% точностью, компьютеру такой уровень понимания недоступен. Алгоритмы распознавания изображений, обученные на натуралистичных фотографиях, не могли справиться с разнообразием художественных стилей, а модели распознавания текста спотыкались о колоритный и многозначный язык диалогов, зависящий от графического контекста, объясняет Ийер.

«ИИ займет 80% профессий в IT-сфере»

Комиксы рассказывают истории, используя последовательность картинок, часто стилизованных и отличающихся от изображения реальных людей и предметов на фотографиях. Их поясняет текст, обычно помещенный внутрь сферического или прямоугольного пространства. Текст и изображение тесно связаны, иногда настолько, что одно без другого непонятно. Но даже когда они присутствуют, читателю приходится делать предположения и экстраполяции, что именно произошло между двумя рисунками. Детали обычно добавляет фантазия читателя.

Именно благодаря промежуткам и умалчиванию в воображении читателя создается история. Комплексный процесс разглядывания отдельного изображения и понимания того, как он связан с предыдущими, называется «смыкание». И пока что это чисто человеческая способность, пишет MIT Technology Review.

Суперконденсатор позволит заряжать телефон за секунды

До сих пор алгоритм принятия решений искусственным интеллектом был человеку непонятен и оттого вызывал страх. Ученые МТИ разработали механизм, с помощью которого нейросети могут рассказать, почему они приняли именно такое решение. В более широком смысле это значит, что алгоритмам можно будет доверять, так как они будут принимать решения понятным для человека образом.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Больше миллиона Гбит в секунду: японцы побили рекорд скорости передачи данных по оптоволокну
Новости
Хаос во благо: физики создали новый инструмент для квантового мира
Наука
Hugging Face выпустила недорогих человекоподобных роботов с открытым кодом
Новости
Китайский аккумулятор для электромобиля выдержал наезд 36-тонного танка
Новости
Воспитанники детских домов изучат основы работы с нейросетями
Новости
Четвероногий робот из Цюриха научился играть в бадминтон с людьми
Новости
В MIT раскрыли механизм набора веса из-за жирной пищи и как обратить его вспять
Наука
60 000 лет рядом: ученые выяснили, кто стал первым паразитом человека
Наука
Ректора Университета Иннополис избрали членом-корреспондентом РАН
Иннополис
В Корее робопса научили паркуру и бегу по стенам: посмотрите, что он может
Новости
Древний череп «человека-муравья» нашли в Аргентине
Наука
На селфи марсохода попал неожиданный объект: его заметили не сразу
Космос
Посмотрите на двух морских коньков, которых застукали за «поцелуем» в океане
Наука
Почти 10 000 роутеров Asus тайно заразили: как проверить свой и защититься
Новости
Ракета будет доставлять товары с AliExpress за час по всему миру: ее испытали в Китае
Новости
В России пригрозили «душить» иностранные сервисы: кто в опасности
Новости
Boston Dynamics усовершенствовала систему восприятия гуманоидного робота Atlas
Новости
Наклейка на лоб анализирует мозговые волны и предсказывает переутомление
Наука
Посмотрите на робота-трансформера, который меняет форму прямо в полете
Новости
Китай отправил миссию за образцами горных пород с квазиспутника Земли
Космос