Большинство сообщений в сети передаются в шифрованном виде, так как открытые каналы связи не защищены от перехвата данных. Мессенджеры, сервисы для виртуального обмена документами, банковские системы — все это требует защиты от взлома данных. Проблема шифрования данных — один из главных вопросов, которым задаются криптографы.
Проблема поиска уязвимости шифров всегда стоит остро. Чтобы избежать их взлома, необходимо усиливать защиту шифров от возможных утечек и тестировать системы шифрования на поиск слабых мест. Все шифры делятся на два больших класса — блочные и поточные. Поточные данные обладают большим преимуществом: они обеспечивают приемлемую скорость передачи информации, в том числе для отправки изображений и видео. Поточное шифрование основано на комбинации данных со случайной последовательностью по особому алгоритму. Для такого шифрования используются специальные ключи. К ключам предъявляется много требований, чтобы зашифрованные с их помощью данные было возможно вырабатывать и хранить. Однако не всегда удается добиться использования надежного ключа. А потому системы поточного шифрования нуждаются в предварительном тестировании на уязвимость.
«Мне было интересно не только предложить алгоритм, способный определять исходный текст передаваемого сообщения, но найти возможности восстановления текста как в теории, так и на практике напрямую — без определения ключа», — комментирует автор работы, аспирантка МИЭМ НИУ ВШЭ Анастасия Малашина. Для задачи поиска уязвимости она исследовала метод, который позволяет оценить возможность бесключевого восстановления отдельных отрезков сообщения в случаях использования уязвимого шифра или утечек в канале связи.
Используя информацию о возможных вариантах каждого из зашифрованных символов исходного сообщения, алгоритм перебирает значения для всех остальных символов. В случае, если в исходном шифре была уязвимость, такой метод позволяет ее обнаружить. Предложенный алгоритм был реализован в специальной программе, часть которой недавно была запатентована. Эта программа позволяет оценить надежность систем шифрования и возможность их взлома в случае утечки данных.
«В ходе работы я исследовала корпус публицистических текстов и открытый корпус русского языка. Статистический анализ словарей позволил оценить энтропию текстов, для которых впоследствии и проводилась оценка возможности частичного дешифрования. Кроме того, словари, составляемые на основе корпусов, используются в экспериментальной части исследования для реализации атаки по словарю. Подобные результаты были получены и для английского языка на основе корпуса iWeb», — добавляет Малашина.
Результаты исследования представлены в статье «Разработка инструментальных средств для исследования информационных характеристик естественного языка».
Читать далее
Создана первая точная карта мира. Что не так со всеми остальными?