Уровень здравого смысла у чатботов — не более 58%

Несколько лет назад чатбот, представившись подростком по имени Юджин Гусман, прошел тест Тьюринга. Поэтому эксперты по ИИ придумали новое испытание по измерению интеллекта компьютерных программ. Winograd Schema Challenge определяет уровень здравого смысла в машинах на основании правильного и точного употребления слов.

Недавно состоялся первый такой конкурс на конференции по искусственному интеллекту в Нью-Йорке. В конкурсе участвовало 6 команд, одна из них предложила три разных подхода. Нужно было ответить на 60 вопросов. При этом просто случайный выбор ответов, наугад, дал бы в результате 44% успешности. А наивысший результат — 58% — означает, что одна из систем справилась лучше, хотя, конечно, этого мало, говорит Чарли Ортиц, один из организаторов мероприятия.

Наилучший результат показал алгоритм Никоса Айзека из Открытого университета Кипра. Они использовали гибридный подход, сочетающий подключение к интернету с использованием вероятностного сопоставления.

Winograd Schema Challenge задает компьютерным программам взятые из детских книжек простые вопросы, которые называются проблемы устранения противоречий в местоимениях (PDP):

Искусственный интеллект поможет варить пиво

«Бабар не знал, где ему достать новую одежду. К счастью, богатый старик, который всегда был добр к слонятам, сразу понял, что ему нужен красивый костюм. Поскольку ему нравилось делать добро, он отдал ему свой кошелек».

В этой фразе пять выделенных полужирным местоимений, каждое из которых относится либо к Бабару, либо к богатому старику. Машине нужно разобраться во всей этой путанице, которая для людей со здравым смыслом не составляет труда, пишет Spectrum IEEE.

По мнению Ортица, Winograd Schema Challenge превосходит тест Тьюринга потому, что здесь есть вопросы, на которые можно ответить различным образом. «И если ответить неправильно, то значит — система не понимает смысла фразы. И мы узнаем, где именно у нее ошибка», — говорит он.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Найден необычный способ бороться с хроническим стрессом
Наука
Посмотрите на самый редкий торнадо, который пронесся над США
Наука
Над Землей пролетел астероид, который вращался быстрее всех остальных
Космос
Ученые показали лицо женщины, которая жила 75 000 лет назад
Наука
Анализ генов показал, как древние водоросли вышли на поверхность планеты
Наука
Древняя технология поможет вырастить растения на Марсе, считают ученые
Космос
Физики из MIT добились рекордной близости между атомами для квантовых исследований
Наука
В Германии на ветряную электростанцию впервые установили деревянные лопасти
Новости
Инженеры разработали искусственную пиявку для безболезненного забора крови у детей
Наука
Solar Orbiter запечатлел «пушистую» корону Солнца в завораживающих деталях
Космос
Китай отправляет миссию на обратную сторону Луны: как смотреть онлайн
Космос
ИИ нашел асимметрию материи и антиматерии на Большом адронном коллайдере
Наука
TikTok вернулся в Россию? Что известно прямо сейчас
Новости
В Японии разработали устройство 6G, которое передает данные со скоростью 100 Гбит/с
Новости
Климатологи объяснили формирование в Антарктиде полыньи размером с Чехию
Наука
Частые кризисы повысили способность человечества выживать
Наука
Физики наблюдали кота Шредингера — превращение атомов из частиц в волну
Наука
Найдена самая глубокая дыра в мире
Наука
«Вышка» заряжает карьеру в IT
Технологии
Ученые создали клей, который работает как паутина Человека-паука (почти)
Наука