Новый тест ставит ИИ-модели в тупик: люди справились лучше

Большинство моделей ИИ не справились с новым тестом, но люди показали неплохие результаты.

Тест ARC-AGI-2 для оценки интеллектуальных способностей ИИ-моделей продемонстрировал огромный разрыв между возможностями современных технологий и человеческим интеллектом, пишет 3D News. Модели, такие как o1-pro и R1, набрали не более 1,3%, в то время как люди показали результат в 60%.  

Что представляет собой тест ARC-AGI-2?  

Фонд Arc Prize Foundation, который создал этот тест, разработал серию головоломок, в которых ИИ должен анализировать визуальные закономерности, решая задачи на основе разноцветных квадратов. В отличие от предыдущих тестов, ARC-AGI-2 не позволяет моделям использовать прошлый опыт, заставляя их адаптироваться к новым задачам.

Как прошли испытания?  

В тестировании участвовало более 400 человек, которые в среднем правильно ответили на 60% заданий. Это значительно превышает результаты ИИ, что подтверждает огромный разрыв в решении задач, требующих адаптации и понимания новых концепций.

Как улучшили тест?  

Шолле, соучредитель Arc Prize Foundation, объяснил, что ARC-AGI-2 является более точным индикатором реального интеллекта ИИ, чем предыдущий тест ARC-AGI-1. В новой версии была исключена возможность решения задач с помощью «метода грубой силы», при котором ИИ использует огромные вычислительные мощности для перебора всех возможных вариантов. Для этого была введена метрика эффективности, которая вынуждает ИИ «на лету» интерпретировать паттерны, а не полагаться на запоминание.

Проблемы с вычислительными затратами  

Тест ARC-AGI-1 был основным в течение пяти лет, пока в декабре 2024 года OpenAI не представила модель o3, которая продемонстрировала достижения, сравнявшиеся с человеческим уровнем. Однако, как оказалось, эти результаты были достигнуты за счет значительных вычислительных затрат.

Как изменится подход к ИИ?  

В ответ на растущие опасения о недостаточной объективности критериев для оценки ИИ, Arc Prize Foundation объявила о запуске конкурса Arc Prize 2025. Участники должны будут достичь 85% точности на ARC-AGI-2, при этом не затратив более $0,42 на решение каждой задачи.

Читать далее:

Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу

Испытания ракеты Starship Илона Маска вновь закончились взрывом в небе

Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды

Обложка: AI | freepik

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Вирус герпеса перестраивает геном человека, но есть способ его остановить
Наука
Разработаны роботы размером с игрушечную машинку для ремонта водопроводных труб
Новости
В Самаре запустили первый в России дата-центр, объединяющий майнинг и ИИ
Новости
Болезнь Паркинсона на ранней стадии определят по ушной сере
Наука
BI-стратегия компании: что она дает и как ее создать
Мнения
В Мариинке показали оперу, которую дописал искусственный интеллект
Новости
Открыт нейронный путь, который приводит к бессонице после перенесенного стресса
Наука
Китайский маглев установил рекорд: разогнался до 650 км/ч за семь секунд
Новости
Австралийские бабочки используют звезды для навигации в пространстве
Наука
Древний череп из Китая впервые позволил понять, как выглядели денисовцы
Наука
Открыта загадочная связь между уровнем кислорода и магнитным полем Земли
Космос
Альтернатива сжиганию: разработана технология переработки угля в высокотехнологичное сырье
Наука
Ракета Starship Илона Маска взорвалась на площадке при подготовке к испытаниям
Космос
TECNO MEGABOOK K15S: универсальный ноутбук для тех, кто работает, создает и отдыхает
Кейсы
Два китайских спутника встретились на орбите Земли
Космос
В Москве пройдет второй Международный технологический конгресс МТК-2025
Новости
Из перовскита создали датчик изображения, который улавливает в три раза больше света
Новости
ИИ научили предсказывать риск провала технологических новинок
Новости
Разработан нанопластырь с микроиглами, который может заменить биопсию
Наука
В глубинах Тихого океана обнаружили пауков, питающихся бактериями
Наука