Новости 1 мая 2025

После обновления ChatGPT стал подхалимом: OpenAI объяснила, что случилось

Далее

Компания поделилась подробностями об обновлении, которое ей пришлось откатить.

OpenAI откатила обновление GPT-4o, из-за которого личность чат-бота стала «чрезмерно льстивой». В компании признали, что в процессе обучения некорректно отработали реакцию пользователей и недостаточно протестировали долгосрочные эффекты общения. Между тем подхалимство «может быть дискомфортным, тревожным и вызывать стресс», говорится в сообщении в блоге компании.

На прошлой неделе компания представила обновление GPT-4o, которое включало корректировки, «направленные на улучшение личности модели по умолчанию, чтобы она казалась более интуитивной и эффективной при выполнении различных задач». OpenAI заявляет, что для формирования поведения использует базовые принципы из спецификации модели. После этого ее дообучают, в том числе на основе реакций пользователей, «включая «палец вверх» / «палец вниз» в ответах ChatGPT».

Однако в последнем обновлении, как считают в OpenAI, «слишком много внимания уделили краткосрочной обратной связи». Ответы и поведение, которые сначала кажутся приятными со временем могут начинать пугать или раздражать. В частности«GPT-4o перекосился в сторону ответов, которые были чрезмерно поддерживающими, но неискренними».

Ранее проблему с обновлением признал генеральный директор компании Сэм Альтман, а пользователи в сети публиковали примеры своих переписок, демонстрируя проблемы модели. Независимо от того, что говорили пользователи, ответом ChatGPT была однообразная похвала — даже, когда пользователи, казалось, проявляли симптомы психического заболевания.

В результате OpenAI вернула предыдущую версию модели и будет работать над улучшениями обучения, включая «уточнение системных подсказок, чтобы явно увести модель от подхалимства» и «расширять способы» предоставления пользователями обратной связи. «Мы также считаем, что пользователи должны иметь больше контроля над поведением ChatGPT, если они не согласны с вариантом по умолчанию», — заявляет компания.


Читать далее:

Женщина ушла от мужа к ChatGPT после 20 лет брака: «Он удовлетворяет меня лучше, чем человек»

Оружие будущего: Япония запустила снаряды из рельсотрона со скоростью 8000 км/ч

Назван неожиданный напиток, который может снизить риск остановки сердца

Обложка: Flickr | Сведения о лицензии