Технологии 20 июня 2016

Новое слово в восстановлении данных

Далее

Российские ученые из Института проблем передачи информации им. А.А. Харкевича Российской академии наук (ИППИ РАН) решили проблему восстановления данных в облачных и распределённых системах, сообщает пресс-служба Института.

Сегодня любая информация распределяется на нескольких серверах или дисках. Это справедливо как для данных персональных компьютеров, так и для виртуальных, «облачных», хранилищ.

Чаще всего применяется два метода защиты информации: дублирование на нескольких дисках и использование кодов Рида-Соломона. Первый способ обеспечивает так называемый back-up или дублирование данных на нескольких дисках. Если один из дисков вышел из строя, можно обратиться к другому, на котором хранится его копия. Такие восстановление данных не занимает много времени, но зато требует большого объема памяти.

Как облачные технологии усовершенствуют работу врачей

Во втором случае объем занимаемой памяти минимален, зато времени требуется значительно больше. Сегодня перед исследователями стоит задача построения кодов со свойством локального восстановления. Они должны восстанавливать вышедший из строя диск с минимальным количеством обращений к другим дискам и минимальным использованием служебной информации и памяти.

Российские ученые предложили общий алгебраический метод кодирования данных, который обладает наилучшей возможной эффективностью. Они исследовали обобщение кодов с локальным восстановлением и получили нижние и верхние границы для параметров кодов с многими восстанавливающими множествами, таких как объем служебной информации и минимальное расстояние.

По словам Алексея Фролова, одного из авторов работы, они рассматривают случай, когда для каждого диска (символа большого алфавита) имеется несколько восстанавливающих множеств дисков: «Это свойство гарантирует высокую доступность данных, к которым происходит частое обращение, ведь при выходе из строя диска, разные пользователи могут восстановить этот диск, обращаясь к разным серверам со служебными данными. Таким образом, достигается оптимальное распределение нагрузки в системе».