Создан алгоритм, автоматически меняющий местоимения в документах полиции

Команда Университета Иннополис разработала алгоритм, автоматически меняющий местоимения в документах полиции. Об этом «Хайтеку» сообщили в пресс-службе вуза.

Новый алгоритм создан во время хакатона «Цифровой прорыв». Сотрудники Центра искусственного интеллекта российского ИТ-вуза победили, разработав решение для кейса Департамента информационных технологий, связи и защиты информации МВД РФ. За 1 место в соревновании они получили 750 тыс. рублей.

От участников хакатона требовалось разработать алгоритм, который проводит лингвистический анализ документов, после чего преобразует повествование от первого лица в текст от третьего лица: например, из сочетания «Я увидел, что Иванов подошел ко мне» в «Он увидел, что Иванов подошел к нему». Команда Университета Иннополис обучила нейронную сеть на датасете новостных сводок объемом 12 Гб. Она размечает принадлежность сказуемого к нужному подлежащему, определяет форму слова и морфологические категории.

Результаты нейросети использовались для написания Python-алгоритма на основе эвристик и правил русского языка. Решение учитывает особую специфику ведомственных текстов (которые не всегда просты в чтении), а также способно обрабатывать художественные тексты. Алгоритм обрабатывает местоимения, глаголы, предлоги, цитаты, прямую речь, определяет принадлежность местоимений к именам и выделяет героев, даты, суммы денег, локации.

Сотрудники российского ИТ-вуза предложили внедрить алгоритм в комплексный сервис с веб-интерфейсом, куда пользователь может вставить текст, загрузить текстовые файлы разных форматов, аудиофайлы для распознавания речи и изображения с текстом. Также разработан плагин для LibreOffice с выделением измененных частей текста.

«Разработанное решение протестировали эксперты из МВД РФ. Алгоритм показал отличные результаты на их примерах. Мы за 48 часов разработали кросс-платформенный автономный продукт, который готов к внедрению в ведомство и способен избавить сотрудников органов внутренних дел от рутинных задач», — рассказал лидер команды, сотрудник Центра искусственного интеллекта Университета Иннополис Семен Киселев.

Читать также

Найдено предполагаемое царство исчезнувших хеттов. Что обнаружили археологи?

Ледник «Судного дня» оказался опаснее, чем думали ученые. Рассказываем главное

Добровольная смерть. Рассказываем, как работает процедура эвтаназии во всем мире

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Хакеры удаленно взломали компьютер, используя соседний Wi-Fi
Новости
«Уэбб» заснял три огромные «невозможные» галактики
Космос
Телескоп запечатлел столкновение галактик на скорости 3,2 млн км/ч
Космос
Укус вместо укола: создана вакцина от малярии, распространяемая комарами
Наука
Физики определили форму отдельного фотона
Наука
Создатели ChatGPT планируют выпустить собственный браузер
Новости
Плотность промышленных роботов в мире удвоилась за семь лет
Новости
В Гибралтаре нашли «фабрику», на которой неандертальцы варили клей
Наука
Nvidia раскрыла, какие товары компании будут в дефиците и когда
Новости
Посмотрите на первое в истории фото звезды из другой галактики
Космос
Чрезвычайно молодую планету нашли у звезды с «кривым» диском
Космос
Предложен способ навигации дронов без GPS: по «отпечаткам рельефа»
Новости
Ученые раскрыли тайну гигантских черных дыр ранней Вселенной
Космос
Microsoft и Atom Computing выпустят коммерческий квантовый компьютер в 2025 году
Новости
Создан робот-голубь, который летает как настоящая птица
Наука
На страницах тысячелетнего Голубого Корана нашли скрытый текст
Наука
Уязвимость ИИ: типы атак LLM-injection и способы защиты от них
Технологии
Intel случайно упомянула о планах по разработке ИИ-ускорителя
Новости
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышел спустя 15 лет: цены, патчи, бесплатный контент и концовка
Новости
Посмотрите, как прототип космоплана Aurora разогнали до 1,1 Маха 
Новости