Чат-боты с ИИ регулярно преувеличивают значимость научных открытий

При обобщении научных исследований большие языковые модели, такие как ChatGPT и DeepSeek, выдают неточные выводы в 73% случаев, показало исследование.

Исследователи протестировали 10 разных версий больших языковых моделей ChatGPT, DeepSeek, Llama и Claude для создания краткого резюме научных исследований. Большинство моделей регулярно делали более широкие выводы, чем авторы работ. При этом если модели в запросе просили избегать неточностей, уровень искажений в ответах чат-ботов возрастал.

Исследование оценивало, насколько точно искусственный интеллект резюмирует краткие обзоры и статьи из ведущих научных и медицинских журналов, включая Nature, Science и The Lancet. Тестируя модели в течение года, ученые собрали 4900 рефератов, сгенерированных чат-ботами. Анализ показал, что шесть из десяти моделей систематически преувеличивали утверждения из исходных текстов, как правило, используя широкие обобщения.

Например, осторожное заявление авторов «Лечение было эффективным в этом исследовании» заменялось на однозначный вариант «Лечение является эффективным». Подобные обобщения могут ввести читателей в заблуждение, заставив их поверить, что результаты применимы в широком контексте ситуаций.

Удивительно, но когда ученые попросили чат-боты избегать неточностей, модели почти в два раза чаще стали делать чрезмерно абстрактные выводы. Исследователи также сравнили резюме одних и тех же статей, созданные чат-ботами и людьми. Неожиданно оказалось, что чат-боты почти в пять раз чаще выдавали широкие обобщения.

Этот эффект вызывает беспокойство. Студенты, исследователи и политики предполагают, что если они попросят ChatGPT избегать неточностей, то получат более надежное резюме. Наши результаты доказывают обратное.

Уве Петерс, соавтор исследования из Утрехтского университета

Примечательно, что новые модели ChatGPT, DeepSeek и Llama допускали больше неточностей, чем предыдущие версии. При этом меньше всего искажений было в отчетах Claude 3.7 Sonnet от компании Anthropic. Ученые рекомендуют пользователям внимательно подбирать подсказки, которые помогут получить менее искаженный вариант, а разработчикам тестировать модели на предмет некорректных обобщений при работе с научной информацией.


Читать далее:

Физики исполнили мечту алхимиков: свинец в коллайдере превратили в золото

Ученые решили проблему, которая мешала запуску термоядерных реакторов почти 70 лет

Вирус-вымогатель впервые встроили прямо в процессор. Удалить его невозможно

На обложке: Изображение от freepik, лицензия

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Живые башни из червей: посмотрите на «суперорганизм», который нашли в саду
Наука
Имплантат сетчатки из нанопроводов восстановил зрение у мышей
Наука
На российских сайтах хотят запретить авторизацию через почту Google
Новости
ИИ против айтишников: как новые инструменты меняют ИТ-бизнес
Мнения
Оказалось, Apple Watch «обманывают» в подсчете калорий
Новости
Китай впервые проверил квантовую связь QSDC на борту многоразовой ракеты
Наука
В Москве пройдет форум MOSТИМ 2025 — обсудят цифровизацию в строительстве и выберут лучших в BIM
Новости
Россиянам могут заблокировать входящие звонки из-за рубежа
Новости
Страдающее «лицо» появилось на Солнце: ученые фиксируют поток частиц в сторону Земли
Космос
Маск и Трамп начали войну в соцсетях: что произошло и какие будут последствия
Кейсы
В Нижнем Новгороде создали «умный» материал для 3D-печати человеческих тканей
Наука
ИИ против супербактерий: в ИТМО создали платформу для поиска новых лекарств
Новости
Парк промышленных роботов в России вырос на 62% за один год
Новости
Геофизики объяснили загадочное ускорение сейсмических волн в недрах Земли
Наука
Семь российских вузов разделят 4,7 млрд рублей на исследования в области ИИ
Иннополис
Найден способ изучать квантовые состояния, которые десятилетиями не получалось поймать
Наука
Каталог кейсов применения квантовых технологий представили в России
Новости
Ozempic и мужское здоровье: как препарат влияет на либидо и восприятие размера пениса
Наука
Землю 2.0 нашли рядом со звездой, похожей на Солнце
Космос
Рыбу «Судного дня» случайно нашли в на пляже: почему ее опасаются
Наука