Компания поделилась подробностями об обновлении, которое ей пришлось откатить.
OpenAI откатила обновление GPT-4o, из-за которого личность чат-бота стала «чрезмерно льстивой». В компании признали, что в процессе обучения некорректно отработали реакцию пользователей и недостаточно протестировали долгосрочные эффекты общения. Между тем подхалимство «может быть дискомфортным, тревожным и вызывать стресс», говорится в сообщении в блоге компании.
На прошлой неделе компания представила обновление GPT-4o, которое включало корректировки, «направленные на улучшение личности модели по умолчанию, чтобы она казалась более интуитивной и эффективной при выполнении различных задач». OpenAI заявляет, что для формирования поведения использует базовые принципы из спецификации модели. После этого ее дообучают, в том числе на основе реакций пользователей, «включая «палец вверх» / «палец вниз» в ответах ChatGPT».
Однако в последнем обновлении, как считают в OpenAI, «слишком много внимания уделили краткосрочной обратной связи». Ответы и поведение, которые сначала кажутся приятными со временем могут начинать пугать или раздражать. В частности«GPT-4o перекосился в сторону ответов, которые были чрезмерно поддерживающими, но неискренними».
Ранее проблему с обновлением признал генеральный директор компании Сэм Альтман, а пользователи в сети публиковали примеры своих переписок, демонстрируя проблемы модели. Независимо от того, что говорили пользователи, ответом ChatGPT была однообразная похвала — даже, когда пользователи, казалось, проявляли симптомы психического заболевания.
the last couple of GPT-4o updates have made the personality too sycophant-y and annoying (even though there are some very good parts of it), and we are working on fixes asap, some today and some this week.
— Sam Altman (@sama) April 27, 2025
at some point will share our learnings from this, it's been interesting.
В результате OpenAI вернула предыдущую версию модели и будет работать над улучшениями обучения, включая «уточнение системных подсказок, чтобы явно увести модель от подхалимства» и «расширять способы» предоставления пользователями обратной связи. «Мы также считаем, что пользователи должны иметь больше контроля над поведением ChatGPT, если они не согласны с вариантом по умолчанию», — заявляет компания.
Читать далее:
Женщина ушла от мужа к ChatGPT после 20 лет брака: «Он удовлетворяет меня лучше, чем человек»
Оружие будущего: Япония запустила снаряды из рельсотрона со скоростью 8000 км/ч
Назван неожиданный напиток, который может снизить риск остановки сердца
Обложка: Flickr | Сведения о лицензии