Стихи, аналитические тексты и шутки: как ИИ научился осмысленно писать

Нейросеть совершенствует свои навыки с каждым этапом обучения: программы учат самым сложным навыкам — творческим. Например, составлять тексты алгоритм уже умеет, с рифмой и без, короткие и длинные, с фабулой и интересным сюжетом. Рассказываем, что может написать ИИ.

Что такое обработка естественного языка?

Обработка текстов на естественном языке — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и синтеза текстов на естественных языках.

Применительно к искусственному интеллекту анализ означает понимание языка, а синтез — генерацию грамотного текста. Решение этих проблем будет означать создание более удобной формы взаимодействия компьютера и человека.

Задачи и ограничения

Теоретически построение естественно-языкового интерфейса для компьютеров — очень привлекательная цель. Ранние системы, такие как SHRDLU, работая с ограниченным «миром кубиков» и используя ограниченный словарный запас, выглядели чрезвычайно хорошо, вдохновляя этим своих создателей. Однако оптимизм быстро иссяк, когда эти системы столкнулись со сложностью и неоднозначностью реального мира.

Понимание естественного языка иногда считают AI-полной задачей, потому как распознавание живого языка требует огромных знаний системы об окружающем мире и возможности с ним взаимодействовать. Само определение смысла слова «понимать» — одна из главных задач искусственного интеллекта.

Сложности понимания русского языка

Качество понимания зависит от множества факторов: от языка, от национальной культуры, от самого собеседника и т. д. Вот некоторые примеры сложностей, с которыми сталкиваются системы понимания текстов.

  • Сложности с раскрытием анафор (распознаванием, что имеется в виду при использовании местоимений): предложения «Мы отдали бананы обезьянам, потому что они были голодные» и «Мы отдали бананы обезьянам, потому что они были перезрелые» похожи по синтаксической структуре. В одном из них местоимение они относится к обезьянам, а в другом — к бананам. Правильное понимание зависит от знаний компьютера, какими могут быть бананы и обезьяны.
  • Свободный порядок слов может привести к совершенно иному толкованию фразы: «Бытие определяет сознание» — что определяет что?
  • В русском языке свободный порядок компенсируется развитой морфологией, служебными словами и знаками препинания, но в большинстве случаев для компьютера это представляет дополнительную проблему.
  • В речи могут встретиться неологизмы, например, глагол «Пятидесятирублируй» — то есть высылай 50 рублей. Система должна уметь отличать такие случаи от опечаток и правильно их понимать.
  • Правильное понимание омонимов — еще одна проблема. При распознавании речи, помимо прочих, возникает проблема фонетических омонимов. Во фразе «Серый волк в глухом лесу встретил рыжую лису» выделенные слова слышатся одинаково, и без знания, кто глухой, а кто рыжий, не обойтись (кроме того, что лиса может быть рыжей, а лес — глухим, лес также может быть рыжим (характеристика, в данном случае обозначающая преобладающий цвет листвы в лесу), в то время как лиса может быть глухой, что порождает дополнительную проблему, вытекающую из предыдущей, хотя и отчасти компенсируется морфологией — у прилагательных в данном предложении род явно разный).

Популярные задачи:

  • Распознавание речи
  • Анализ текста:
  • извлечение информации,
  • информационный поиск,
  • анализ высказываний,
  • анализ тональности текста,
  • вопросно-ответные системы.
  • Генерирование текста
  • Синтез речи

Общая классификация:

  • Категоризация текстов
  • Классификация последовательностей символов:
  • распознавание именованных сущностей,
  • определение частей речи слов.
  • Распознавание фраз
  • Извлечение информации из текста
  • Синтаксическая аннотация
  • Семантическая аннотация
  • Генерирование текста:
  • генерация текста на основе распознанной речи,
  • машинный перевод,
  • обобщение текста.

Как пишущий ИИ использует в работе?

  • The Washington Post

В августе 2016 года The Washington Post впервые стало использовать бота Heliograf, который писал короткие новости об Олимпийских играх в Рио-де-Жанейро. Производительность «Гелиографа» впечатляла: бот генерировал новости быстрее, чем редактор успевал поставить задачу, а читатели не отличали автоматические заметки от написанных вручную.

  • Bloomberg

Около 30% всех новостей Bloomberg сегодня создаются при помощи модуля Cyborg. Он генерирует их по шаблону: что произошло, когда, где, с кем, кто и как прокомментировал событие. Так экономятся затраты на репортеров, но совсем без них обойтись не получается. Cyborg — просто система автоматизации, а не продвинутый ИИ.

  • Reuters

Международное агентство Reuters использует ПО News Tracer. Это инструмент прогнозирования с элементами ИИ, который оценивает появляющиеся в Twitter истории на основе статистических и репутационных критериев. Бот проверяет свыше 700 млн твитов каждый день.

  • The Guardian

Впервые искусственный интеллект вышел за пределы новостных заметок и стал генерировать аналитические статьи. В январе 2019 года The Guardian опубликовала первую историю, написанную искусственным интеллектом ReporterMate. Она была посвящена объемам пожертвований, собранным разными партиями в Австралии. Помимо текста, ИИ сгенерировал графики и составил рейтинг партий по итогам сборов.

Читать далее

Создана первая точная карта мира. Что не так со всеми остальными?

Самое штормовое место на Земле: почему пролив Дрейка — опаснейший путь в Антарктику

Новое урановое соединение побило рекорд аномальной проводимости

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Ученые впервые наблюдали, как орангутанг занимается самолечением
Наука
SpaceX не смогла скрыть полет ракеты над Россией: в сети публикуют фото
Космос
Зонд «Эйнштейн» показал первую партию редких космических фото
Космос
Миссию по доставке образцов с загадочной стороны Луны запустили в Китае
Наука
Ученые подтвердили ключевые события из Библии
Наука
Недалеко от нас есть планета, где ветер дует быстрее пули
Космос
Найден необычный способ бороться с хроническим стрессом
Наука
Посмотрите на самый редкий торнадо, который пронесся над США
Наука
Над Землей пролетел астероид, который вращался быстрее всех остальных
Космос
Ученые показали лицо женщины, которая жила 75 000 лет назад
Наука
Анализ генов показал, как древние водоросли вышли на поверхность планеты
Наука
Древняя технология поможет вырастить растения на Марсе, считают ученые
Космос
Физики из MIT добились рекордной близости между атомами для квантовых исследований
Наука
В Германии на ветряную электростанцию впервые установили деревянные лопасти
Новости
Инженеры разработали искусственную пиявку для безболезненного забора крови у детей
Наука
Solar Orbiter запечатлел «пушистую» корону Солнца в завораживающих деталях
Космос
Китай отправляет миссию на обратную сторону Луны: как смотреть онлайн
Космос
ИИ нашел асимметрию материи и антиматерии на Большом адронном коллайдере
Наука
TikTok вернулся в Россию? Что известно прямо сейчас
Новости
В Японии разработали устройство 6G, которое передает данные со скоростью 100 Гбит/с
Новости