Создан алгоритм, автоматически меняющий местоимения в документах полиции

Команда Университета Иннополис разработала алгоритм, автоматически меняющий местоимения в документах полиции. Об этом «Хайтеку» сообщили в пресс-службе вуза.

Новый алгоритм создан во время хакатона «Цифровой прорыв». Сотрудники Центра искусственного интеллекта российского ИТ-вуза победили, разработав решение для кейса Департамента информационных технологий, связи и защиты информации МВД РФ. За 1 место в соревновании они получили 750 тыс. рублей.

От участников хакатона требовалось разработать алгоритм, который проводит лингвистический анализ документов, после чего преобразует повествование от первого лица в текст от третьего лица: например, из сочетания «Я увидел, что Иванов подошел ко мне» в «Он увидел, что Иванов подошел к нему». Команда Университета Иннополис обучила нейронную сеть на датасете новостных сводок объемом 12 Гб. Она размечает принадлежность сказуемого к нужному подлежащему, определяет форму слова и морфологические категории.

Результаты нейросети использовались для написания Python-алгоритма на основе эвристик и правил русского языка. Решение учитывает особую специфику ведомственных текстов (которые не всегда просты в чтении), а также способно обрабатывать художественные тексты. Алгоритм обрабатывает местоимения, глаголы, предлоги, цитаты, прямую речь, определяет принадлежность местоимений к именам и выделяет героев, даты, суммы денег, локации.

Сотрудники российского ИТ-вуза предложили внедрить алгоритм в комплексный сервис с веб-интерфейсом, куда пользователь может вставить текст, загрузить текстовые файлы разных форматов, аудиофайлы для распознавания речи и изображения с текстом. Также разработан плагин для LibreOffice с выделением измененных частей текста.

«Разработанное решение протестировали эксперты из МВД РФ. Алгоритм показал отличные результаты на их примерах. Мы за 48 часов разработали кросс-платформенный автономный продукт, который готов к внедрению в ведомство и способен избавить сотрудников органов внутренних дел от рутинных задач», — рассказал лидер команды, сотрудник Центра искусственного интеллекта Университета Иннополис Семен Киселев.

Читать также

Найдено предполагаемое царство исчезнувших хеттов. Что обнаружили археологи?

Ледник «Судного дня» оказался опаснее, чем думали ученые. Рассказываем главное

Добровольная смерть. Рассказываем, как работает процедура эвтаназии во всем мире

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Источник в СМИ назвал возможную причину сбоя рунета
Новости
Мошенники начали выдавать себя за начальников в рабочих чатах: как это работает
Новости
Холодные атомы этого металла могут создавать новые состояния материи
Наука
Древние артефакты в Украине раскрыли тайны навигации викингов
Наука
Послушайте, как звучат вспышки на Солнце: данные собрал Solar Orbiter  
Космос
Тяжелый беспилотник на водородных топливных ячейках впервые испытали в Китае
Новости
Ученые создали катализатор, который нарушает законы физики
Наука
Физики обнаружили необычные магнитные свойства в трехслойном графене
Наука
Биоинженеры создали ДНК-робота, который может менять форму искусственной клетки
Наука
«Горы» на нейтронных звездах могут вызывать рябь в пространстве-времени
Космос
На телах древних мумий из Перу нашли сложные узоры татуировок
Наука
У черной дыры прячется белый карлик, движущийся с половиной скорости света
Космос
Стартап из России разрабатывает нанопротез для восстановления поврежденных нервов
Наука
Генетики разгадали секреты выживания устойчивой к антибиотикам бактерии
Наука
Астрофизики разгадали тайну космических ускорителей частиц
Космос
Илон Маск: Neuralink поставил мозговой имплант третьему пациенту
Новости
В Китае дроны вызвали снегопад в горах, чтобы решить проблему с недостатком воды
Новости
«Сестра Клеопатры» оказалась римским больным подростком
Наука
2024 год стал самым жарким за полтора века: впервые превышен предел в 1,5°С
Наука
Юпитер оказался не таким, как считали ученые: открытие опровергает гипотезу о гиганте
Космос