Стихи, аналитические тексты и шутки: как ИИ научился осмысленно писать

Нейросеть совершенствует свои навыки с каждым этапом обучения: программы учат самым сложным навыкам — творческим. Например, составлять тексты алгоритм уже умеет, с рифмой и без, короткие и длинные, с фабулой и интересным сюжетом. Рассказываем, что может написать ИИ.

Что такое обработка естественного языка?

Обработка текстов на естественном языке — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и синтеза текстов на естественных языках.

Применительно к искусственному интеллекту анализ означает понимание языка, а синтез — генерацию грамотного текста. Решение этих проблем будет означать создание более удобной формы взаимодействия компьютера и человека.

Задачи и ограничения

Теоретически построение естественно-языкового интерфейса для компьютеров — очень привлекательная цель. Ранние системы, такие как SHRDLU, работая с ограниченным «миром кубиков» и используя ограниченный словарный запас, выглядели чрезвычайно хорошо, вдохновляя этим своих создателей. Однако оптимизм быстро иссяк, когда эти системы столкнулись со сложностью и неоднозначностью реального мира.

Понимание естественного языка иногда считают AI-полной задачей, потому как распознавание живого языка требует огромных знаний системы об окружающем мире и возможности с ним взаимодействовать. Само определение смысла слова «понимать» — одна из главных задач искусственного интеллекта.

Сложности понимания русского языка

Качество понимания зависит от множества факторов: от языка, от национальной культуры, от самого собеседника и т. д. Вот некоторые примеры сложностей, с которыми сталкиваются системы понимания текстов.

  • Сложности с раскрытием анафор (распознаванием, что имеется в виду при использовании местоимений): предложения «Мы отдали бананы обезьянам, потому что они были голодные» и «Мы отдали бананы обезьянам, потому что они были перезрелые» похожи по синтаксической структуре. В одном из них местоимение они относится к обезьянам, а в другом — к бананам. Правильное понимание зависит от знаний компьютера, какими могут быть бананы и обезьяны.
  • Свободный порядок слов может привести к совершенно иному толкованию фразы: «Бытие определяет сознание» — что определяет что?
  • В русском языке свободный порядок компенсируется развитой морфологией, служебными словами и знаками препинания, но в большинстве случаев для компьютера это представляет дополнительную проблему.
  • В речи могут встретиться неологизмы, например, глагол «Пятидесятирублируй» — то есть высылай 50 рублей. Система должна уметь отличать такие случаи от опечаток и правильно их понимать.
  • Правильное понимание омонимов — еще одна проблема. При распознавании речи, помимо прочих, возникает проблема фонетических омонимов. Во фразе «Серый волк в глухом лесу встретил рыжую лису» выделенные слова слышатся одинаково, и без знания, кто глухой, а кто рыжий, не обойтись (кроме того, что лиса может быть рыжей, а лес — глухим, лес также может быть рыжим (характеристика, в данном случае обозначающая преобладающий цвет листвы в лесу), в то время как лиса может быть глухой, что порождает дополнительную проблему, вытекающую из предыдущей, хотя и отчасти компенсируется морфологией — у прилагательных в данном предложении род явно разный).

Популярные задачи:

  • Распознавание речи
  • Анализ текста:
  • извлечение информации,
  • информационный поиск,
  • анализ высказываний,
  • анализ тональности текста,
  • вопросно-ответные системы.
  • Генерирование текста
  • Синтез речи

Общая классификация:

  • Категоризация текстов
  • Классификация последовательностей символов:
  • распознавание именованных сущностей,
  • определение частей речи слов.
  • Распознавание фраз
  • Извлечение информации из текста
  • Синтаксическая аннотация
  • Семантическая аннотация
  • Генерирование текста:
  • генерация текста на основе распознанной речи,
  • машинный перевод,
  • обобщение текста.

Как пишущий ИИ использует в работе?

  • The Washington Post

В августе 2016 года The Washington Post впервые стало использовать бота Heliograf, который писал короткие новости об Олимпийских играх в Рио-де-Жанейро. Производительность «Гелиографа» впечатляла: бот генерировал новости быстрее, чем редактор успевал поставить задачу, а читатели не отличали автоматические заметки от написанных вручную.

  • Bloomberg

Около 30% всех новостей Bloomberg сегодня создаются при помощи модуля Cyborg. Он генерирует их по шаблону: что произошло, когда, где, с кем, кто и как прокомментировал событие. Так экономятся затраты на репортеров, но совсем без них обойтись не получается. Cyborg — просто система автоматизации, а не продвинутый ИИ.

  • Reuters

Международное агентство Reuters использует ПО News Tracer. Это инструмент прогнозирования с элементами ИИ, который оценивает появляющиеся в Twitter истории на основе статистических и репутационных критериев. Бот проверяет свыше 700 млн твитов каждый день.

  • The Guardian

Впервые искусственный интеллект вышел за пределы новостных заметок и стал генерировать аналитические статьи. В январе 2019 года The Guardian опубликовала первую историю, написанную искусственным интеллектом ReporterMate. Она была посвящена объемам пожертвований, собранным разными партиями в Австралии. Помимо текста, ИИ сгенерировал графики и составил рейтинг партий по итогам сборов.

Читать далее

Создана первая точная карта мира. Что не так со всеми остальными?

Самое штормовое место на Земле: почему пролив Дрейка — опаснейший путь в Антарктику

Новое урановое соединение побило рекорд аномальной проводимости

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Физики придумали, как раскрыть тайну темной материи
Космос
Ученые рассказали, как экстремальный холод влияет на сон
Наука
Марсианский метеорит раскрыл тайны воды на Красной планете
Космос
Хакеры удаленно взломали компьютер, используя соседний Wi-Fi
Новости
«Уэбб» заснял три огромные «невозможные» галактики
Космос
Телескоп запечатлел столкновение галактик на скорости 3,2 млн км/ч
Космос
Укус вместо укола: создана вакцина от малярии, распространяемая комарами
Наука
Физики определили форму отдельного фотона
Наука
Создатели ChatGPT планируют выпустить собственный браузер
Новости
Плотность промышленных роботов в мире удвоилась за семь лет
Новости
В Гибралтаре нашли «фабрику», на которой неандертальцы варили клей
Наука
Nvidia раскрыла, какие товары компании будут в дефиците и когда
Новости
Посмотрите на первое в истории фото звезды из другой галактики
Космос
Чрезвычайно молодую планету нашли у звезды с «кривым» диском
Космос
Предложен способ навигации дронов без GPS: по «отпечаткам рельефа»
Новости
Ученые раскрыли тайну гигантских черных дыр ранней Вселенной
Космос
Microsoft и Atom Computing выпустят коммерческий квантовый компьютер в 2025 году
Новости
Создан робот-голубь, который летает как настоящая птица
Наука
На страницах тысячелетнего Голубого Корана нашли скрытый текст
Наука
Уязвимость ИИ: типы атак LLM-injection и способы защиты от них
Технологии