Новости 1 мая 2025

После обновления ChatGPT стал подхалимом: OpenAI объяснила, что случилось

Компания поделилась подробностями об обновлении, которое ей пришлось откатить.

OpenAI откатила обновление GPT-4o, из-за которого личность чат-бота стала «чрезмерно льстивой». В компании признали, что в процессе обучения некорректно отработали реакцию пользователей и недостаточно протестировали долгосрочные эффекты общения. Между тем подхалимство «может быть дискомфортным, тревожным и вызывать стресс», говорится в сообщении в блоге компании.

На прошлой неделе компания представила обновление GPT-4o, которое включало корректировки, «направленные на улучшение личности модели по умолчанию, чтобы она казалась более интуитивной и эффективной при выполнении различных задач». OpenAI заявляет, что для формирования поведения использует базовые принципы из спецификации модели. После этого ее дообучают, в том числе на основе реакций пользователей, «включая «палец вверх» / «палец вниз» в ответах ChatGPT».

Однако в последнем обновлении, как считают в OpenAI, «слишком много внимания уделили краткосрочной обратной связи». Ответы и поведение, которые сначала кажутся приятными со временем могут начинать пугать или раздражать. В частности«GPT-4o перекосился в сторону ответов, которые были чрезмерно поддерживающими, но неискренними».

Ранее проблему с обновлением признал генеральный директор компании Сэм Альтман, а пользователи в сети публиковали примеры своих переписок, демонстрируя проблемы модели. Независимо от того, что говорили пользователи, ответом ChatGPT была однообразная похвала — даже, когда пользователи, казалось, проявляли симптомы психического заболевания.

the last couple of GPT-4o updates have made the personality too sycophant-y and annoying (even though there are some very good parts of it), and we are working on fixes asap, some today and some this week.

at some point will share our learnings from this, it's been interesting.
— Sam Altman (@sama) April 27, 2025

В результате OpenAI вернула предыдущую версию модели и будет работать над улучшениями обучения, включая «уточнение системных подсказок, чтобы явно увести модель от подхалимства» и «расширять способы» предоставления пользователями обратной связи. «Мы также считаем, что пользователи должны иметь больше контроля над поведением ChatGPT, если они не согласны с вариантом по умолчанию», — заявляет компания.

Читать далее:

Женщина ушла от мужа к ChatGPT после 20 лет брака: «Он удовлетворяет меня лучше, чем человек»

Оружие будущего: Япония запустила снаряды из рельсотрона со скоростью 8000 км/ч

Назван неожиданный напиток, который может снизить риск остановки сердца

^{Обложка: Flickr | Сведения о лицензии}