ИИ научился притворяться человеком: что с этим делать и как его разоблачить

Крис Саад, бывший глава отдела разработки продуктов в Uber, разработал новую платформу для оценки интеллекта искусственного интеллекта. Фреймворк основан на теории о том, что ИИ не является монолитной конструкцией. «Хайтек» рассказывает, почему платформа должна заменить стандартный тест Тьюринга и что это такое.

ИИ стал популярной темой за последние несколько месяцев после того, как OpenAI опубликовала диалоговый чат-бот ChatGPT. Пользователи протестировали его во многих различных областях, от написания стихов до кода и даже коммерческих предложений. Результаты его работы не только впечатляют, но и вызывают опасения.

Что такое тест Тьюринга?

Тест Тьюринга предложил Алан Тьюринг в статье «Вычислительные машины и разум», опубликованной в 1950 году в философском журнале Mind. Ученый задался целью определить, может ли машина мыслить. Сам тест должен был «раскусить» любой ИИ в попытке притвориться человеком. Но область искусственного интеллекта прошла долгий путь с момента появления теста более 70 лет назад.

Диаграмма: поведение человека и разумное поведение. Фото: Commons.wikimedia.org

Идея проверки предполагала общение человека с другим, используя компьютерную программу в течение пяти минут, только в текстовом режиме. Если компьютер сможет обмануть как минимум 30% собеседников, тест считается пройденным. Эксперты общаются одновременно с живым человеком и роботом, находясь в разных комнатах и не видя друг друга. По окончании теста каждый из них должен сказать, кто из двух его собеседников был человеком, а кто — программой.

Когда его прошли впервые?

Его пытались пройти с 1960-х годов, и в 2014 году это удалось программе Eugene Goostman («Евгений Густман»), которая выдавала себя за 13-летнего мальчика по имени Евгений Густман из Одессы. Ей удалось убедить общавшихся с ней людей в том, что выдаваемые ею ответы принадлежат живому, реальному человеку. В прошлом году ИИ Google LaMDA также прошел тест Тьюринга.

В чем проблема теста?

Тест Тьюринга работает по упрощенной схеме «пройдено/не пройдено» и в значительной степени фокусируется на чате/лингвистических возможностях, которые являются лишь одним из аспектов человеческого интеллекта. Он игнорирует многие другие важные аспекты интеллекта, такие как решение проблем, творчество и социальная осведомленность. Кроме того, тест Тьюринга предполагает уровень интеллекта, подобный человеческому, который может не иметь значения или быть бесполезным для оценки ИИ.

Что такое «Теория множественного интеллекта»?

В 1983 году психолог Говард Гарднер утверждал, что интеллект представляет собой совокупность различных способностей, которые могут проявляться по-разному, и разделил их на восемь типов.

Гарднер выделил восемь различных типов интеллекта: по его словам, люди могут преуспеть в одной или нескольких из этих областей, и каждый тип интеллекта независим от других. Теория бросила вызов традиционному взгляду на интеллект как на единую фиксированную сущность и открыла новые возможности для изучения разнообразия человеческого познания. Хотя теория множественного интеллекта на протяжении многих лет подвергалась некоторой критике и спорам, она оказала значительное влияние на область психологии и образования. Так появилась «Теория множественного интеллекта».

Что предложили взамен и как это работает?

Крис Саад, бывший глава отдела разработки продуктов в Uber, назвал эту концепцию «идеальной в качестве основы для фреймворка классификации ИИ» и создал структуру классификации на ее основе. Она оценивает инструменты ИИ по нескольким измерениям: лингвистическо-вербальному, логико-математическому, музыкальному, зрительно-пространственному, телесно-кинестетическому, межличностному и внутриличностному интеллекту.

Для каждого измерения интеллекта схема предлагает шкалу от 1 до 5, где 1 — называется No Capability («неспособный»), а 5 — Self-agency («самостоятельный»). Первый уровень эквивалентен младенцу человека, а пятый — «сверхразуму», чей интеллект выше человеческих способностей.

Автор: Chris Saad

Сам фреймворк доступен по ссылке. Также Крис Саад создал простое визуальное представление для удобного использования. 

Как справился ChatGPT ?

Согласно тесту, ChatGPT показывает третий уровень в двух измерениях: лингвистическо-вербальном и логико-математическом.

Это значит, что он генерирует и/или анализирует совершенно новые математические формулы и доказательства экспертного уровня на основе подсказок на обычном языке. Также он создает и/или анализирует совершенно новый письменный контент экспертного уровня на основе подсказок на естественном языке.

Автор: Chris Saad

В остальных измерениях — музыкальном, зрительно-пространственном, телесно-кинестетическом, межличностном и внутриличностном — ChatGPT получил ноль или «не показал способностей в этой области».

Как справился DALL-E?

DALL-E — нейронная сеть, также авторства OpenAI, созданная при финансовой поддержке Microsoft, способная генерировать высококачественные изображения, исходя из текстовых описаний на английском языке, тоже проверили с помощью новой системы.

Согласно тесту, DALL-E показывает третий уровень в одном измерении: зрительно-пространственном. Это значит, что ИИ генерирует и/или анализирует сложные визуальные сцены. При анализе может отслеживать объекты, несмотря на окклюзию или другие визуальные шумы. Способен прогнозировать и отслеживать сложные движения. При генерации можно создавать совершенно новые статические визуальные представления на основе подсказок на обычном языке.

В лингвистическо-вербальном, логико-математическом, музыкальном, телесно-кинестетическом, межличностном и внутриличностном интеллекте он показал нулевой уровень.

Читать далее:

Форма Млечного Пути совсем не такая, как мы считали все это время, выяснили ученые

Две суперземли нашли на краю обитаемой зоны: на одной из них комфортная температура

Найдена черная дыра, которая уничтожает звезду рекордно близко к Земле

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Ученые впервые наблюдали, как орангутанг занимается самолечением
Наука
SpaceX не смогла скрыть полет ракеты над Россией: в сети публикуют фото
Космос
Зонд «Эйнштейн» показал первую партию редких космических фото
Космос
Миссию по доставке образцов с загадочной стороны Луны запустили в Китае
Наука
Ученые подтвердили ключевые события из Библии
Наука
Недалеко от нас есть планета, где ветер дует быстрее пули
Космос
Найден необычный способ бороться с хроническим стрессом
Наука
Посмотрите на самый редкий торнадо, который пронесся над США
Наука
Над Землей пролетел астероид, который вращался быстрее всех остальных
Космос
Ученые показали лицо женщины, которая жила 75 000 лет назад
Наука
Анализ генов показал, как древние водоросли вышли на поверхность планеты
Наука
Древняя технология поможет вырастить растения на Марсе, считают ученые
Космос
Физики из MIT добились рекордной близости между атомами для квантовых исследований
Наука
В Германии на ветряную электростанцию впервые установили деревянные лопасти
Новости
Инженеры разработали искусственную пиявку для безболезненного забора крови у детей
Наука
Solar Orbiter запечатлел «пушистую» корону Солнца в завораживающих деталях
Космос
Китай отправляет миссию на обратную сторону Луны: как смотреть онлайн
Космос
ИИ нашел асимметрию материи и антиматерии на Большом адронном коллайдере
Наука
TikTok вернулся в Россию? Что известно прямо сейчас
Новости
В Японии разработали устройство 6G, которое передает данные со скоростью 100 Гбит/с
Новости