ИИ не смог понять комиксы

Мохит Ийер из Университета Мэриленда и его коллеги смогли дать обоснованный ответ на вопрос: "В чем искусственный интеллект еще не преуспел?". Оказывается, ИИ трудно дается чтение комиксов.

Ийер и его коллеги провели эксперимент: создали большую базу данных комиксов для обучения компьютера (за основу взяли золотой век этого жанра, с 1930-х по 1950-е гг.), 4000 книг, 1,2 млн отдельных изображений. Оцифровали весь текст.

Затем машине показывали последовательность картинок. Она должна была предсказать, что будет дальше, выбрав один вариант ответа. Например, узнать следующую картинку или текст или сопоставить текст с конкретным персонажем.

Результат был неожиданным: тогда как человек способен ответить на эти вопросы с 80% точностью, компьютеру такой уровень понимания недоступен. Алгоритмы распознавания изображений, обученные на натуралистичных фотографиях, не могли справиться с разнообразием художественных стилей, а модели распознавания текста спотыкались о колоритный и многозначный язык диалогов, зависящий от графического контекста, объясняет Ийер.

«ИИ займет 80% профессий в IT-сфере»

Комиксы рассказывают истории, используя последовательность картинок, часто стилизованных и отличающихся от изображения реальных людей и предметов на фотографиях. Их поясняет текст, обычно помещенный внутрь сферического или прямоугольного пространства. Текст и изображение тесно связаны, иногда настолько, что одно без другого непонятно. Но даже когда они присутствуют, читателю приходится делать предположения и экстраполяции, что именно произошло между двумя рисунками. Детали обычно добавляет фантазия читателя.

Именно благодаря промежуткам и умалчиванию в воображении читателя создается история. Комплексный процесс разглядывания отдельного изображения и понимания того, как он связан с предыдущими, называется «смыкание». И пока что это чисто человеческая способность, пишет MIT Technology Review.

Суперконденсатор позволит заряжать телефон за секунды

До сих пор алгоритм принятия решений искусственным интеллектом был человеку непонятен и оттого вызывал страх. Ученые МТИ разработали механизм, с помощью которого нейросети могут рассказать, почему они приняли именно такое решение. В более широком смысле это значит, что алгоритмам можно будет доверять, так как они будут принимать решения понятным для человека образом.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Вот те Na+: пять плюсов ИБП на натриевых аккумуляторах
Технологии
Тайны древней звезды по соседству изучили, «подслушав ее песню»
Космос
Baidu делает ИИ для перевода звуков животных в человеческую речь
Наука
Оказалось, ИИ врет чаще при одном условии: как этого избежать
Новости
Суперкомпьютер Маска сжирает электричество как 300 000 домов: люди протестуют
Новости
Посмотрите, как робот стремительно отбивает подачи в настольном теннисе
Новости
Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото
Наука
Создано музыкальное приложение для реабилитации после инсульта
Наука
«Эффект аккордеона» превращает жесткий графен в эластичный материал
Наука
ИИ восстановил имя автора свитка, который пережил последний день Помпеи
Наука
Частный лунный модуль вышел на орбиту спутника после двух месяцев полета
Космос
Предок тираннозавра «иммигрировал» в Америку из Азии, считают ученые
Наука
Обновленный Gemini 2.5 Pro от Google возглавил рейтинг ИИ для разработчиков
Новости
Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет
Наука
Китайское «супероружие» для подводных диверсий оказалось не таким, как считалось
Новости
Отключение мобильного интернета в Москве: какие последствия для бизнеса
Новости
Киберполиция назвала новые схемы мошенников: как они воруют аккаунты на «Госуслугах»
Новости
Хокинг предсказал гибель Земли: оказалось, НАСА сочло угрозу реальной
Наука
Создатель Ethereum признал свои ошибки и решил изменить криптовалюту
Новости
«Ред ОС 8» заработала на Arm-платформах — теперь и на «Байкале»
Новости