Метод принимает неполитические директивы или запросы — те, которые используют невежливый или нейтральный язык — и реструктурирует их либо добавляет слова, чтобы сделать их более воспитанными. «Пришлите мне данные», например, может превратиться в «Не могли бы вы выслать мне данные?».
Исследователи представят свое исследование о компьютерной вежливости на ежегодном собрании Ассоциации компьютерной лингвистики, которое состоится практически с 5 июля.
Идея о передаче стиля или настроения из одного сообщения в другое — например, превращение негативных утверждений в позитивные — это то, что языковые технологи уже давно делают. Шримай Прабхумойе, доктор философии, студент в Институте языковых технологий (LTI), заявил, что выполнение задачи по передачи вежливого тона уже давно является целью технологий.
Это чрезвычайно важно для некоторых приложений, например, если вы хотите, чтобы ваши электронные письма или чат-боты звучали более вежливо, или если вы пишете блог. Но мы никогда не могли найти правильные данные для выполнения этой задачи.
Шримай Прабхумойе, доктор философии, студент в Институте языковых технологий (LTI)
Группа ученых решила эту проблему, сгенерировав набор данных в 1,39 млн предложений, помеченных как «для вежливости», его они и использовали в своих экспериментах.
Источник этих предложений может показаться удивительным. Они были получены из электронных писем, которыми обменивались сотрудники Enron, расположенной в Техасе в энергетической компании, которая до закрытия в 2001 году была известна корпоративным мошенничеством и коррупцией. Но полмиллиона корпоративных электронных писем стали общедоступными в результате судебных процессов, связанных с мошенническим скандалом Enron, и впоследствии были использованы в качестве набора данных для различных исследовательских проектов.
Но даже с набором данных исследователи должны были просто определить вежливость. Речь идет не только об использовании таких слов, как «пожалуйста» и «спасибо». Иногда это означает, что необходимо сделать язык немного менее прямым. Поэтому вместо того, чтобы сказать «Вы должны сделать X», предложение становится чем-то вроде «Давайте сделаем X».
Набор данных вежливости был проанализирован, чтобы определить частоту и распределение слов в вежливых предложениях. Затем команда разработала конвейер для передачи вежливости. Сначала помечаются невежливые слова или фразы, а затем текстовый генератор заменяет каждый помеченный элемент. Система заботится о том, чтобы не изменить смысл предложения.
Читать также
Выяснилось, что заставило цивилизацию майя покинуть свои города
Посмотрите на закат в других мирах: как Солнце заходит на Марсе, Титане и Уране