Создан алгоритм, автоматически меняющий местоимения в документах полиции

Команда Университета Иннополис разработала алгоритм, автоматически меняющий местоимения в документах полиции. Об этом «Хайтеку» сообщили в пресс-службе вуза.

Новый алгоритм создан во время хакатона «Цифровой прорыв». Сотрудники Центра искусственного интеллекта российского ИТ-вуза победили, разработав решение для кейса Департамента информационных технологий, связи и защиты информации МВД РФ. За 1 место в соревновании они получили 750 тыс. рублей.

От участников хакатона требовалось разработать алгоритм, который проводит лингвистический анализ документов, после чего преобразует повествование от первого лица в текст от третьего лица: например, из сочетания «Я увидел, что Иванов подошел ко мне» в «Он увидел, что Иванов подошел к нему». Команда Университета Иннополис обучила нейронную сеть на датасете новостных сводок объемом 12 Гб. Она размечает принадлежность сказуемого к нужному подлежащему, определяет форму слова и морфологические категории.

Результаты нейросети использовались для написания Python-алгоритма на основе эвристик и правил русского языка. Решение учитывает особую специфику ведомственных текстов (которые не всегда просты в чтении), а также способно обрабатывать художественные тексты. Алгоритм обрабатывает местоимения, глаголы, предлоги, цитаты, прямую речь, определяет принадлежность местоимений к именам и выделяет героев, даты, суммы денег, локации.

Сотрудники российского ИТ-вуза предложили внедрить алгоритм в комплексный сервис с веб-интерфейсом, куда пользователь может вставить текст, загрузить текстовые файлы разных форматов, аудиофайлы для распознавания речи и изображения с текстом. Также разработан плагин для LibreOffice с выделением измененных частей текста.

«Разработанное решение протестировали эксперты из МВД РФ. Алгоритм показал отличные результаты на их примерах. Мы за 48 часов разработали кросс-платформенный автономный продукт, который готов к внедрению в ведомство и способен избавить сотрудников органов внутренних дел от рутинных задач», — рассказал лидер команды, сотрудник Центра искусственного интеллекта Университета Иннополис Семен Киселев.

Читать также

Найдено предполагаемое царство исчезнувших хеттов. Что обнаружили археологи?

Ледник «Судного дня» оказался опаснее, чем думали ученые. Рассказываем главное

Добровольная смерть. Рассказываем, как работает процедура эвтаназии во всем мире

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Альтернативу Apple Pay для iPhone тестируют в России: как она работает
Новости
Сверхзвуковой «Конкорд» возвращается: почему в США поменяли мнение о самолете
Новости
Mars Orbiter теперь «стоит на голове»: зачем это нужно НАСА
Космос
В Москве дожди, а в пустыне — выпал снег: посмотрите на редкое явление из космоса
Космос
Обнаружено самое далекое мини-гало: радиосигнал прошел 10 млрд световых лет
Космос
Товары для взрослых начнут продавать онлайн по биометрии
Новости
Две трети абитуриентов выбирают ИИ как приоритетное ИТ-направление
Наука
Тираннозавр был не таким, как в фильмах, рассказывает палеонтолог
Наука
Google запустил ИИ-приложение для виртуальной примерки одежды
Новости
В России создали ИИ для защиты памятников от разрушения при строительстве
Новости
Галактику Андромеды показали такой, какой ее еще не видели
Космос
Минспорт требует от киберспортсменов бег и отжимания: новый стандарт вызвал споры
Новости
AAEON выпустила самый компактный одноплатный компьютер с чипами Intel Core 13-го поколения
Наука
Этот паразит годами незаметно поедает мозг: названы главные признаки
Наука
Посмотрите на редкое фото Сатурна: это затмение не увидеть еще 15 лет
Космос
Старые смартфоны превратили в подводные центры обработки данных
Новости
Телескоп в Антарктиде зафиксировал первый свет Вселенной с рекордной точностью
Космос
Орангутаны тоже спят сиесту: днем приматы компенсируют ночной недосып
Наука
Искусственный интеллект науился писать код для компьютерных чипов
Новости
Кофеин активирует механизм, который замедляет старение в клетках
Наука