ИИ впервые прошел тест Тьюринга: GPT-4.5 обманул людей в 73% случаев

В слепом тестировании участники эксперимента чаще считали человеком чат-бот, чем реальных собеседников. Препринт публикации, которая пока не прошла официального рецензирования, опубликован на портале arXiv.

Впервые модель искусственного интеллекта официально прошла тест Тьюринга — способ оценки способности машины выдавать себя за человека. В эксперименте, которые провели ученые из Калифорнийского университета в Сан-Диего, участники принимали модель GPT-4.5 от OpenAI за человека в 73% случаев при трехстороннем общении.

Тест Тьюринга, предложенный математиком Аланом Тьюрингом в 1950 году, долгое время считался золотым стандартом для определения человекоподобного интеллекта машин. В классической версии теста человек-экзаменатор общается одновременно с человеком и компьютером через текстовый интерфейс и пытается определить, кто есть кто.

В эксперименте участвовало около 300 человек, которых случайным образом разделили на две группы: половина была экзаменаторами, а вторая половина — пыталась доказать, что они люди. Каждый экзаменатор общался параллельно с человеком и с чат-ботом. В конце теста участников просили определить, кто из двух собеседников искусственный интеллект.

Тесты провели в двух вариантах: в одном ИИ предварительно просили принять роль определенного человека, например, молодого интернет-гика. В других случаях чат-бот действовал без подсказок. В режиме имитации человека сразу две модели показали результаты выше 50%: GPT-4.5 приняли за человека в 75,5% случаев, а LLaMa от Meta* — в 64,7%.

Результаты тестирования моделей.

Примечательно, что без специальных подсказок результаты были существенно ниже — GPT-4.5 достигла лишь 36% успеха, а GPT-4o — всего 21%. Удивительным открытием стало то, что даже примитивный чат-бот ELIZA, разработанный около 80 лет назад, показал результат в 23%.

Попробовать опознать искусственный интеллект можно на сайте проекта.

Эксперты отмечают, что прохождение теста Тьюринга не означает, что ИИ действительно мыслит как человек. Современные языковые модели тренируются на огромных объемах текста, созданного людьми, что позволяет им мастерски имитировать человеческую речь даже в ситуациях, когда они не понимают сути вопроса.

* Компания Meta Platforms Inc. признана в России экстремистской. Деятельность компании и принадлежащих ей социальных сетей Facebook и Instagram на территории РФ запрещена


Читать далее:

Ученые в тупике: «Уэбб» засек невозможный свет в галактике

Живые клетки обрабатывают информацию в миллиарды раз быстрее, чем считалось ранее

Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу

Иллюстрация на обложке: designed by Freepikсведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Больше миллиона Гбит в секунду: японцы побили рекорд скорости передачи данных по оптоволокну
Новости
Хаос во благо: физики создали новый инструмент для квантового мира
Наука
Hugging Face выпустила недорогих человекоподобных роботов с открытым кодом
Новости
Китайский аккумулятор для электромобиля выдержал наезд 36-тонного танка
Новости
Воспитанники детских домов изучат основы работы с нейросетями
Новости
Четвероногий робот из Цюриха научился играть в бадминтон с людьми
Новости
В MIT раскрыли механизм набора веса из-за жирной пищи и как обратить его вспять
Наука
60 000 лет рядом: ученые выяснили, кто стал первым паразитом человека
Наука
Ректора Университета Иннополис избрали членом-корреспондентом РАН
Иннополис
В Корее робопса научили паркуру и бегу по стенам: посмотрите, что он может
Новости
Древний череп «человека-муравья» нашли в Аргентине
Наука
На селфи марсохода попал неожиданный объект: его заметили не сразу
Космос
Посмотрите на двух морских коньков, которых застукали за «поцелуем» в океане
Наука
Почти 10 000 роутеров Asus тайно заразили: как проверить свой и защититься
Новости
Ракета будет доставлять товары с AliExpress за час по всему миру: ее испытали в Китае
Новости
В России пригрозили «душить» иностранные сервисы: кто в опасности
Новости
Boston Dynamics усовершенствовала систему восприятия гуманоидного робота Atlas
Новости
Наклейка на лоб анализирует мозговые волны и предсказывает переутомление
Наука
Посмотрите на робота-трансформера, который меняет форму прямо в полете
Новости
Китай отправил миссию за образцами горных пород с квазиспутника Земли
Космос