После обновления ChatGPT стал подхалимом: OpenAI объяснила, что случилось

Компания поделилась подробностями об обновлении, которое ей пришлось откатить.

OpenAI откатила обновление GPT-4o, из-за которого личность чат-бота стала «чрезмерно льстивой». В компании признали, что в процессе обучения некорректно отработали реакцию пользователей и недостаточно протестировали долгосрочные эффекты общения. Между тем подхалимство «может быть дискомфортным, тревожным и вызывать стресс», говорится в сообщении в блоге компании.

На прошлой неделе компания представила обновление GPT-4o, которое включало корректировки, «направленные на улучшение личности модели по умолчанию, чтобы она казалась более интуитивной и эффективной при выполнении различных задач». OpenAI заявляет, что для формирования поведения использует базовые принципы из спецификации модели. После этого ее дообучают, в том числе на основе реакций пользователей, «включая «палец вверх» / «палец вниз» в ответах ChatGPT».

Однако в последнем обновлении, как считают в OpenAI, «слишком много внимания уделили краткосрочной обратной связи». Ответы и поведение, которые сначала кажутся приятными со временем могут начинать пугать или раздражать. В частности«GPT-4o перекосился в сторону ответов, которые были чрезмерно поддерживающими, но неискренними».

Ранее проблему с обновлением признал генеральный директор компании Сэм Альтман, а пользователи в сети публиковали примеры своих переписок, демонстрируя проблемы модели. Независимо от того, что говорили пользователи, ответом ChatGPT была однообразная похвала — даже, когда пользователи, казалось, проявляли симптомы психического заболевания.

В результате OpenAI вернула предыдущую версию модели и будет работать над улучшениями обучения, включая «уточнение системных подсказок, чтобы явно увести модель от подхалимства» и «расширять способы» предоставления пользователями обратной связи. «Мы также считаем, что пользователи должны иметь больше контроля над поведением ChatGPT, если они не согласны с вариантом по умолчанию», — заявляет компания.


Читать далее:

Женщина ушла от мужа к ChatGPT после 20 лет брака: «Он удовлетворяет меня лучше, чем человек»

Оружие будущего: Япония запустила снаряды из рельсотрона со скоростью 8000 км/ч

Назван неожиданный напиток, который может снизить риск остановки сердца

Обложка: Flickr | Сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Оптический транзистор разогнали до 240 ГГц: это основа для компьютеров нового поколения
Новости
Google бросает вызов ChatGPT: в поисковике появилась вкладка с ИИ
Новости
Посмотрите, как рождаются планеты: опубликованы самые четкие изображения в истории
Космос
Рыбы в виртуальной реальности обучают роботов двигаться косяками
Новости
У мертвой звезды нашли самую холодную из известных планет
Космос
«Википедия» внедрит ИИ: это будет работать и что станет с редакторами
Новости
Поднимет и авианосец: для реактора ИТЭР сделали мощнейший магнит в мире
Наука
Посмотрите на маневренный дрон с крыльями, как у белки-летяги
Новости
Недалеко от Земли нашли странную группу молодых звезд, стремящихся разлететься в разные стороны
Космос
Летучие мыши учатся подслушивать за сексом лягушек, чтобы выбрать добычу
Наука
В МФТИ разработана технология для создания долговечной памяти электронных устройств
Наука
Зонд «Юнона» рассмотрел холодный северный полюс Юпитера
Космос
Роботы-собаки Unitree стреляют водой на 60 метров, чтобы тушить пожары
Новости
Самки бонобо научились держать самцов «в узде»: как им удалось
Наука
Снайперы застрелили с вертолетов 700 коал: власти Австралии объяснили, зачем это сделали
Наука
Бесплатную смену по подготовке к ЕГЭ проведут в Университете Иннополис 
Новости
Назван неожиданный напиток, который может снизить риск остановки сердца
Наука
Эффективность российской вакцины от пыльцы проверят уже в этом году
Наука
Назван необычный побочный эффект вакцин от гриппа: он встречается у женщин
Наука
Большой Ку: тестируем бюджетный QLED-TV с огромной диагональю
Технологии