способ восстановления записей в запоминающем устройстве, система для его осуществления и машиночитаемый носитель

Классы МПК:G06F12/16 защита от потерь данных в памяти
G11C29/52 защита содержимого памяти; обнаружение ошибок в содержимом памяти
Патентообладатель(и):Федоров Андрей Рюрикович (RU)
Приоритеты:
подача заявки:
2010-07-01
публикация патента:

Изобретение относится к вычислительной технике. Технический результат заключается в увеличении скорости расчетов при восстановлении дисков. Способ восстановления записей в запоминающем устройстве, в котором при записи данных в информационные зоны запоминающего устройства в его соответствующие контрольные зоны заносят по меньшей мере две эталонных контрольных суммы, вычисленные по заранее установленным формулам, а в процессе использования запоминающего устройства неоднократно вычисляют с помощью вычислительного блока текущие контрольные суммы по тем же формулам для каждого набора кодовых слов с одинаковыми номерами во всех информационных зонах и сравнивают каждую из вычисленных текущих контрольных сумм с соответствующей эталонной контрольной суммой для нахождения синдрома ошибок и замены выявленных ошибок записи правильными значениями. 3 н. и 8 з.п. ф-лы, 1 ил.

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Формула изобретения

1. Способ восстановления записей в запоминающем устройстве, заключающийся в том, что:

разделяют область памяти упомянутого запоминающего устройства на информационные зоны и контрольные зоны;

записывают каждую группу подлежащих запоминанию данных в виде набора кодовых слов в соответствующую информационную зону;

находят при каждой записи подлежащих запоминанию данных в упомянутое запоминающее устройство с помощью соответствующего вычислительного блока по меньшей мере две эталонных контрольных суммы, каждую по соответствующей заранее установленной формуле, для каждого набора кодовых слов с одинаковыми номерами во всех упомянутых информационных зонах;

записывают каждую из найденных контрольных сумм в виде кодового слова с тем же номером в соответствующую контрольную зону;

в процессе использования упомянутого запоминающего устройства неоднократно вычисляют с помощью упомянутого вычислительного блока текущие контрольные суммы по упомянутым заранее установленным формулам для каждого набора кодовых слов с одинаковыми номерами во всех информационных зонах;

сравнивают с помощью упомянутого вычислительного блока каждую из вычисленных текущих контрольных сумм с соответствующей эталонной контрольной суммой для набора кодовых слов с теми же номерами, записанной в соответствующую контрольную зону, для нахождения синдрома ошибок;

при нахождении упомянутого синдрома ошибок заменяют выявленные ошибки записи правильными значениями;

при этом упомянутое выявление ошибок записи производят путем соответствующих вычислений с помощью упомянутого вычислительного блока над многочленами, в которых в качестве коэффициентов используют упомянутые кодовые слова с одинаковыми номерами во всех информационных зонах, а в качестве порождающего многочлена, по модулю которого производят соответствующие вычисления над упомянутыми многочленами, используют такой многочлен, который не обладает свойством неразложимости на множители и порождает конечное кольцо.

2. Способ по п.1, в котором количество вычисляемых контрольных сумм равно двум, в качестве упомянутых заранее установленных формул для вычисления контрольных сумм используют формулы:

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 и

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 ,

где Di - i-я информационная зона, в которую записаны кодовые слова di1, di2 , способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , diS; i=0, способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , N-1; gi - коэффициент, S - количество кодовых слов, которое можно записать в i-ю информационную зону,

а ошибки записи выявляют путем решения получающейся из этих формул системы уравнений.

3. Способ по п.2, в котором в качестве упомянутого порождающего многочлена используют многочлен:

x128+x7+x2+x+1.

4. Способ по любому из пп.1-3, в котором упомянутый вычислительный блок входит в состав упомянутого запоминающего устройства.

5. Способ по любому из пп.1-3, в котором упомянутый вычислительный блок является внешним по отношению к упомянутому запоминающему устройству.

6. Система для восстановления записей в запоминающем устройстве, содержащая упомянутое запоминающее устройство, включающее в себя N информационных зон и по меньшей мере две контрольные зоны, и вычислительный блок, при этом:

каждая из упомянутых N информационных зон запоминающего устройства выполнена с возможностью записи в нее группы подлежащих запоминанию данных в виде набора кодовых слов;

каждая из упомянутых по меньшей мере двух контрольных зон запоминающего устройства выполнена с возможностью записи в нее соответствующей контрольной суммы;

упомянутый вычислительный блок выполнен с возможностью:

нахождения по меньшей мере двух эталонных контрольных сумм, каждую по соответствующей заранее установленной формуле, для каждого i-го набора кодовых слов, где i=0, способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , N-1, во всех упомянутых N информационных зонах при каждой записи подлежащих запоминанию данных в упомянутое запоминающее устройство;

неоднократного вычисления в процессе использования упомянутого запоминающего устройства текущих контрольных сумм по упомянутым заранее установленным формулам для каждого i-го набора кодовых слов во всех упомянутых N информационных зонах;

сравнения каждой из вычисленных текущих контрольных сумм с соответствующей эталонной контрольной суммой, записанной в соответствующую из упомянутых контрольных зон, для нахождения синдрома ошибок;

выявления ошибок записи по найденному синдрому ошибок и замены выявленных ошибок записи правильными значениями путем соответствующих вычислений над многочленами, при которых в качестве коэффициентов используют упомянутые кодовые слова с одинаковыми номерами во всех N информационных зонах, а в качестве порождающего многочлена, по модулю которого производят соответствующие вычисления над упомянутыми многочленами, используют такой многочлен, который не обладает свойством неразложимости на множители и порождает конечное кольцо.

7. Система по п.6, в которой количество вычисляемых контрольных сумм равно двум, в качестве упомянутых заранее установленных формул для вычисления контрольных сумм используют формулы:

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 и

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 ,

где Di - i-я информационная зона, в которую записаны кодовые слова di1, di2 , способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , diS; i=0, способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , N-1; gi - коэффициент, S - количество кодовых слов, которое можно записать в i-ю информационную зону,

а ошибки записи выявляют путем решения получающейся из этих формул системы уравнений.

8. Система по п.7, в которой в качестве упомянутого порождающего многочлена используют многочлен:

x128+x7+x2+x+1.

9. Система по любому из пп.6-8, в которой упомянутый вычислительный блок входит в состав упомянутого запоминающего устройства.

10. Система по любому из пп.6-8, в которой упомянутый вычислительный блок является внешним по отношению к упомянутому запоминающему устройству.

11. Машиночитаемый носитель, предназначенный для непосредственного участия в работе компьютера и содержащий компьютерную программу, при исполнении которой в компьютере выполняются действия способа по любому из пп.1-3.

Описание изобретения к патенту

Область техники, к которой относится изобретение

Настоящее изобретение относится к системам записи информации для записи информации большого объема, когда используются наборы из нескольких запоминающих устройств, чаще всего дисковых. В частности, данное изобретение к способу и системе восстановления записей в запоминающем устройстве и к машиночитаемому носителю с соответствующей программой.

Уровень техники

Для запоминания больших объемов информации используются запоминающие устройства, составленные из дисковых массивов. Эти массивы из нескольких дисков обычно построены по технологии RAID (Redundant Array of Inexpensive Disks, массив резервных недорогих дисков; иногда это сокращение раскрывают как Redundant Array of Independent Disks, массив резервных независимых дисков). Такие массивы состоят из нескольких дисков, управляемых контроллером и взаимосвязанных скоростными каналами передачи данных. Внешняя система «воспринимает» такой массив как единое целое. В настоящее время применяется технология RAID-6, согласно которой в набор дисков добавляют два дополнительных диска, хранящих постоянно обновляемые контрольные суммы. Благодаря этому обеспечивается возможность восстановления информации в случае выхода из строя одного или двух дисков в массиве (См., например, Anvin, H.P. (21 May 2009 г.). The mathematics of RAID-6. Получено 18 ноября 2009 года по адресу http://ftp.kernel.org/pub/linux/kernel/people/hpa/raid6.pdf).

Способы и системы восстановления записей в массивах RAID-6 описаны в таких патентных документах: патенты США № № 5499253 (опубл. 12.03.1996), 5948110 (опубл. 07.09.1999), 6148430 (опубл. 14.11.2000), 6823425 (опубл. 23.11.2004), 6891690 (опубл. 10.05.2005), 6959413 (опубл. 25.10.2005), 7076606 (опубл. 11.07.2006), 7343546 (опубл. 11.03.2008), 7360143 (опубл. 15.04.2008), 7392458 (опубл. 24.06.2008), 7437658 (опубл. 14.10.2008), 7600176 (опубл. 06.10.2009); в заявках на патент США № № 2008/0177815 (опубл. 28.07.2008), 2009/0024879 (опубл. 22.01.2009), 2009/0132851 (опубл. 21.05.2009); в заявке Великобритании № 2429809 (опубл. 07.03.2007); в выложенных заявках Японии № № 08-171463 (опубл. 02.07.1996) и 2000-259359 (опубл. 22.09.2000).

Однако все эти технические решения весьма сложны вследствие того, что вычисления в них выполняются с использованием арифметики конечных полей или полей Галуа, и все ухищрения в этих и некоторых иных патентных документах направлены на некоторые упрощения при таких вычислениях. Поясним это утверждение следующим образом.

Как показано на чертеже, дисковый массив состоит из N дисков данных, обозначенных D1, D2, способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , DN, и два контрольных диска, обозначенных Р и Q. Каждый диск в наборе рассматривается как набор из S байтов, причем все диски имеют одинаковый размер, т.е. содержат одинаковое количество байтов S. Байт с номером j на i-м диске Di данных обозначен как dij. Для байтов с одинаковыми номерами i с каждого диска Di рассчитываются две контрольные суммы по специальному алгоритму. Каждая сумма тоже имеет размер один байт. Эти два байта (на фиг.1 они обозначены как р и q) записываются на контрольные диски Р и Q под тем же номером j.

Вычисления контрольных сумм производится по нижеследующим формулам (1'), (2'):

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

где gi есть некоторые коэффициенты.

Тогда в случае отказа двух дисков данных с номерами х и y для восстановления утраченной информации необходимо решить данную систему уравнений относительно DX и DY .

Технически это выглядит таким образом, что при попытке чтения информации с отказавших дисков данных производится решение системы уравнений (1') и (2') относительно D X и DY и полученный результат возвращается в качестве результата операции чтения.

Однако сложность указанных вычислений существенно возрастает с размером слова. Поэтому используются слова размером всего в один байт. Причина роста сложности состоит в необходимости применять арифметику конечных полей (полей Галуа), а в наборе команд современных компьютеров нет соответствующих команд. Поля Галуа «большого размера» очень сложно построить, но еще сложнее производить в них вычисления.

В данном контексте сложность следует понимать как необходимость большого количества вычислений, которые требуют временных затрат и, соответственно, снижают производительность дисковых массивов.

В действительности вычисления в полях Галуа организуются как вычисления с многочленами по модулю некоторого неприводимого многочлена. Т.е. каждый байт рассматривается как набор коэффициентов многочлена. Например, байт 10011011, у которого разряды соответствуют степеням двойки, начиная с 0 (справа) и кончая 7 (слева), можно рассматривать как следующий многочлен: х7431 +1. Соответственно, коэффициенты могут быть равны только нулю и единице, а для операций сложения, умножения и деления необходимо создавать специальные подпрограммы. Эти подпрограммы должны осуществлять обычные арифметические операции с многочленами (сложение, умножение), после чего находить остаток от деления результата на некоторый специальный многочлен, именуемый «порождающим». Этот многочлен должен обладать важным свойством: он должен быть неразложим на множители.

Существенно, что при вычислениях по наиболее трудоемким формулам (2') и (3') основными операциями являются операция умножения на многочлен х и нахождение остатка от деления на «порождающий» многочлен.

Для ускорения вычислений могут использоваться заранее подготовленные таблицы умножения. Таблицы помогают ускорить вычисления, но их размер слишком быстро возрастает с размером поля, и поэтому практически они могут быть использованы только с полями, элементы которых имеют размер в один байт. В существующих реализациях диски данных разбиваются на байты, и вычисления повторяются столько раз, сколько имеется байтов на диске данных.

Раскрытие изобретения

Таким образом, имеется необходимость в разработке такого технического решения, которое обеспечивало бы существенное увеличение скорости расчетов при восстановлении дисков. Следует отметить, что диски в принципе являются лишь одним из наиболее распространенных вариантов объемной памяти, так что предлагаемое изобретение направлено в общем случае на любое запоминающее устройство.

Для решения поставленной задачи и достижения вышеуказанного технического результата в первом объекте по настоящему изобретению предложен способ восстановления записей в запоминающем устройстве, заключающийся в том, что: разделяют область памяти запоминающего устройства на информационные зоны и контрольные зоны; записывают каждую группу подлежащих запоминанию данных в виде набора кодовых слов в соответствующую информационную зону; находят при каждой записи подлежащих запоминанию данных в запоминающее устройство с помощью соответствующего вычислительного блока по меньшей мере две эталонных контрольных суммы, каждую по соответствующей заранее установленной формуле, для каждого набора кодовых слов с одинаковыми номерами во всех информационных зонах; записывают каждую из найденных контрольных сумм в виде кодового слова с тем же номером в соответствующую контрольную зону; в процессе использования запоминающего устройства неоднократно вычисляют с помощью вычислительного блока текущие контрольные суммы по заранее установленным формулам для каждого набора кодовых слов с одинаковыми номерами во всех информационных зонах; сравнивают с помощью вычислительного блока каждую из вычисленных текущих контрольных сумм с соответствующей эталонной контрольной суммой для набора кодовых слов с теми же номерами, записанной в соответствующую контрольную зону, для определения синдрома ошибок; при определении синдрома ошибок заменяют выявленные ошибки записи правильными значениями; при этом выявление ошибок записи производят путем соответствующих вычислений с помощью вычислительного блока над многочленами, в которых в качестве коэффициентов используют кодовые слова с одинаковыми номерами во всех информационных зонах, а в качестве порождающего многочлена, по модулю которого производят соответствующие вычисления над многочленами, используют такой многочлен, который не обладает свойством неразложимости на множители и порождает конечное кольцо.

Для решения той же задачи и достижения того же технического результата во втором объекте по настоящему изобретению предложена система для восстановления записей в запоминающем устройстве, содержащая запоминающее устройство, включающее в себя N информационных зон и по меньшей мере две контрольные зоны, и вычислительный блок, при этом каждая из N информационных зон запоминающего устройства выполнена с возможностью записи в нее группы подлежащих запоминанию данных в виде набора кодовых слов; каждая из по меньшей мере двух контрольных зон запоминающего устройства выполнена с возможностью записи в нее соответствующей контрольной суммы; вычислительный блок выполнен с возможностью нахождения по меньшей мере двух эталонных контрольных сумм, каждую по соответствующей заранее установленной формуле, для каждого i-го набора кодовых слов, где i=0, способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , N-1, во всех N информационных зонах при каждой записи подлежащих запоминанию данных в запоминающее устройство; неоднократного вычисления, в процессе использования запоминающего устройства, текущих контрольных сумм по заранее установленным формулам для каждого i-го набора кодовых слов во всех N информационных зонах; сравнения каждой из вычисленных текущих контрольных сумм с соответствующей эталонной контрольной суммой, записанной в соответствующую из контрольных зон, для определения синдрома ошибок; выявления ошибок записи путем соответствующих вычислений над многочленами, при которых в качестве коэффициентов используют кодовые слова с одинаковыми номерами во всех N информационных зонах, а в качестве порождающего многочлена, по модулю которого производят соответствующие вычисления над многочленами, используют такой многочлен, который не обладает свойством неразложимости на множители и порождает конечное кольцо.

Особенность как способа, так и системы по настоящему изобретению состоит в том, что количество вычисляемых контрольных сумм может быть равно двум, в качестве заранее установленных формул для вычисления контрольных сумм можно использовать формулы

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 и

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 ,

где Di - i-ая информационная зона, в которую записаны кодовые слова di1, d i2, способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , diS; i=0, способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , N-1; gi - коэффициент, S - количество кодовых слов, которое можно записать в i-ую информационную зону, а ошибки записи выявляют путем решения получающейся из этих формул системы уравнений. При этом в качестве порождающего многочлена можно использовать многочлен вида х1287 2+х+1.

Еще одна особенность как способа, так и системы по настоящему изобретению состоит в том, что вычислительный блок может как входить в состав запоминающего устройства, так и быть внешним блоком по отношению к запоминающему устройству.

Наконец, для решения той же задачи и достижения того же технического результата в третьем объекте по настоящему изобретению предложен машиночитаемый носитель, предназначенный для непосредственного участия в работе компьютера и содержащий компьютерную программу, при исполнении которой в компьютере выполняются действия вышеупомянутого способа.

Краткое описание чертежей

Настоящее изобретение иллюстрируется чертежом, который условно показывает известный в уровне техники дисковый массив в качестве запоминающего устройства.

Подробное описание варианта осуществления изобретения

Нижеследующее подробное описание сделано на основе иллюстративного примера, в котором запоминающее устройство представляет собой дисковый массив, построенный по технологии RAID-6. He надо, однако, думать, что настоящее изобретение ограничивается только такими запоминающими устройствами. Разумеется, настоящее изобретение может быть не менее эффективно применено и к запоминающим устройствам иного типа, например к запоминающим устройствам, построенным на основе флэш-памяти.

Суть настоящего изобретения заключается в предложении использовать не поля Галуа, а конечные кольца, в которых имеется достаточное количество обратимых элементов, чтобы было возможно решить уравнения (1') и (2'), а также использовать многочлен, не обладающий свойством неразложимости на множители, в качестве порождающего многочлена.

Рассмотрим вначале подробнее те преобразования, которые осуществляются при вычислениях в полях Галуа для дискового массива.

Каждый диск массива будем рассматривать как множество слов и будем рассматривать вычисления внутри одного слова, подразумевая, что одинаковые вычисления производятся над всеми словами.

Пусть имеется N дисков данных D0, D1, D2 , способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , DN-1.

Вычислим значение величины Р, именуемой синдромом

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Тогда в случае утраты одного диска D x данных для его восстановления достаточно будет решить уравнение (1) относительно этого диска. Если в качестве операции сложения использовать операцию побитового сложения по модулю два, то можно записать

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Для защиты от утраты двух или более дисков необходимо составить систему из линейно независимых уравнений, решение которых позволит восстановить утраченные диски в количестве, равном количеству уравнений в системе. Для нас практический интерес представляет система из двух уравнений, позволяющая восстанавливать данные в случае потери двух дисков

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Если обозначить потерянные диски D x и Dy, то для восстановления Dy имеем

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Объединив эти два уравнения и учитывая, что в качестве операции сложения используем побитовое сложение по модулю два, имеем

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Имея значение Dy и используя (2), можно восстановить и значение Dx. Но для того, чтобы вычисления по формуле (3) состоялись, кроме операции сложения нам необходимо иметь в своем распоряжении операцию умножения, а для вычислений по формуле (4) еще и операцию нахождения обратного элемента (деление). Поэтому для построения массивов RAID-6 обычно используется арифметика конечных полей (полей Галуа), т.к. именно поля представляют собой алгебраические структуры, которые имеют операции умножения, сложения и деления на ненулевой элемент и замкнуты относительно этих операций.

Здесь важен тот факт, что требование обратимости всех ненулевых элементов для вычислений по формуле (4) является избыточным. Достаточно того, чтобы обратимыми были выражения gx и способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 для хспособ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 y, 0<х, y<N. Иными словами, нет необходимости строить поле Галуа, достаточно найти подходящее кольцо.

Обратимся теперь к общей структуре и расширениям полей Галуа.

Пусть имеется простое поле GF(p). Его расширение до поля CF(ps) может осуществляться путем присоединения корней многочлена xq-1-1, где q=ps. При этом мультипликативная группа поля состоит из корней из единицы в степени s. Рассмотрим случай, когда s разлагается на множители s=nk. Все корни из единицы степени n являются и корнями степени s=nk. Это означает, что поле GF(pn) лежит в поле GF(p nk). Говоря иными словами, поле GF(pnk) является расширением поля GF(pn) степени k. Соответственно, оно может быть получено построением кольца многочленов GF(p n)[x] и дальнейшей факторизацией по модулю некоторого многочлена способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х) степени k, неприводимого над GF(pn).

Прикладное значение этого факта состоит в том, что, имея реализацию вычислений в поле GF(pn) можно свести вычисления в большем поле GF(pnk) к полиномиальной арифметике по модулю способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х).

Сейчас важно обратить внимание на факт замкнутости поля относительно операций сложения, умножения и деления. Поскольку операции с многочленами сводятся к последовательности операций с их коэффициентами, кольцо многочленов над GF(p n) лежит внутри кольца многочленов над GF(pnk ). Это же наблюдение в полной мере относится и к конечным кольцам многочленов, полученных путем факторизации по модулю многочлена над GF(pn). А отсюда немедленно следует важное прикладное утверждение:

Лемма 1. Пусть способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 [х]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х) - конечное кольцо многочленов над GF(pn) по модулю некоторого многочлена способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х), а способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 '[х]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х) - конечное кольцо многочленов над GF(pnk ) по модулю того же многочлена. Тогда, если элемент способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 [x]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х) обратим в способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 [х]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х), то он обратим и в способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 [х]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х).

У этой леммы есть два интересных в прикладном смысле частных случая.

Во-первых, если способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х) неприводим над способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 [х], то способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 [х]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х) является полем, а значит в нем обратимы все ненулевые элементы. В соответствии с вышеприведенной леммой они же будут обратимы и в расширении способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 '[x]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (x). Это означает, что если для вычисления синдрома (3) выбраны gi из некоторого поля, то можно использовать их и для вычислений в расширении этого поля.

Во-вторых, при р=2 и n=1 все элементы способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 [х]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х) являются многочленами с коэффициентами из GF(2), т.е равны 0 или 1. Это означает, что и в расширении способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 '[x]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (x) при вычислении по уравнениям (3) и (4) все операции умножения сводятся к умножению на 0 и 1, которое можно считать умножением только в фундаментальном смысле. Опираясь на данный факт, при построении дисковых массивов RAID-6 можно вообще исключить трудоемкую операцию умножения в полях Галуа.

В дальнейшем нас будут интересовать только различные расширения поля GF(2). Элементы этого поля будем обозначать 0 и 1, и в качестве операций поля будем использовать сложение по модулю два и логическое умножение (конъюнкцию).

Многочлены с коэффициентами GF(2) будем записывать в виде последовательности нулей и единиц, начиная со старшего коэффициента, и для краткости записи естественным образом преобразовывать их в шестнадцатиричное число. Например

x5+x2+1способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 100101способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 25

х4+х+1способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 10011способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 13.

Поскольку элементы поля GF(2n ) и вообще произвольного конечного кольца GF(2)[x]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (x) можно представить в виде многочленов, естественным образом распространим на них эту форму записи.

В дальнейшем записанное таким образом поле (или кольцо) будем называть базовым.

Продолжим расширение базового поля до кольца многочленов GF(2n)[y]. Будем записывать элементы этого кольца в виде набора коэффициентов из базового поля, начиная с младшего. Например

7y2 +y+12способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (12, 1, 7)

25y4+13y2 +1способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (1, 0, 13, 25)

Так как элементы произвольного конечного кольца GF(2n)[y]/способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (y) (в том числе и элементы поля GF(2nk)) можно, в свою очередь, представить как многочлены над GF(2n ), распространим на них эту же форму записи.

Операции умножения и сложения в кольцах многочленов сводятся к операциям сложения и умножения их коэффициентов в базовом поле. При вычислениях в конечных кольцах возникает необходимость использовать и операцию нахождения остатка от деления на многочлен, по модулю которого построено кольцо. Это, в свою очередь, влечет за собой необходимость использования операции деления на старший коэффициент способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х). В дальнейшем при построении конечного кольца всегда будем использовать многочлен со старшим коэффициентом, равным единице (Это, кстати, позволяет аналогичным образом строить расширения не только полей Галуа, но и любых конечных коммутативных колец с единицей).

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Для вычислений синдрома Q по формуле (3) удобно выбрать некий элемент g и построить все необходимые элементы gi по формуле

gi=gi+1 , где i=0, способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , n-1.

Тогда вычисления синдрома Q можно будет проводить по схеме Горнера

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Формула (4) для вычисления потерянного диска при этом может быть записана следующим образом

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Или

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Запись в виде (6) позволяет также использовать схему Горнера при вычислении наиболее трудоемкой части, а именно второй суммы в числителе.

Нужно только быть уверенным в том, что все gi - разные. С алгебраической точки зрения это означает, что порядок выбранного элемента g в кольце должен быть меньше количества защищаемых дисков. Т.е.

giспособ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 g, где способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 i: 0<i<N.

В качестве элемента g удобно выбрать многочлен (0, 1). Тогда умножение произвольного многочлена на этот многочлен в нашей форме записи сводится к сдвигу на один разряд вправо и сложению

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361

Для выполнения этой операции в общем случае требуется k операций умножения и k-1 операций сложения. Но есть шанс найти такой полином способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (х), коэффициенты которого равны только 0 и 1, причем количество нулей достаточно велико. Действительно, в соответствии с леммой 1 достаточно найти способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 (x) с коэффициентами из GF(2) и затем использовать его в расширении GF(2n), причем n может быть сколь угодно большим. При этом не нужно даже проверять неприводимость полинома, достаточно проверить, что элемент g=(0, 1) обратим, а также обратимы все (1+gy-x) для хспособ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 y, 0<x, y<N.

Таким свойством при N=100 обладает, например, полином

x128+x 7+x2+x+1.

Для выполнения операции умножения на элемент (0,1) по модулю этого многочлена необходимо осуществить четыре операции сложения в базовом поле. На самом деле, поскольку в базовом поле умножения не осуществляется, задачи построения поля вообще не существует. В качестве элементов этого базового поля можно использовать сколь угодно большую последовательность битов с операцией сложения по модулю два.

Для сравнения выберем элемент g из базового поля g=(g0 ). Тогда операция умножения сведется к умножению всех коэффициентов на g0 в базовом поле

способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 .

Именно таким образом производятся вычисления в классическом варианте. Каждый диск разбивается на байты, вычисления в которых производятся независимо друг от друга. Здесь же это частный случай. Для осуществления одной операции умножения на g он требует k операций умножения в базовом поле. Для сравнения, в предыдущем примере, который требовал только четырех операций сложения, k=128. При этом в отличие от предыдущего варианта g 0 не может быть равным единице и, соответственно, операции умножения нетривиальны.

Итак, суть предложенного метода вычислений состоит в том, что вычисления будут осуществляться с многочленами, но в качестве коэффициентов этих многочленов будем брать не отдельные биты, а элементы «небольших полей» целиком, то есть, например, байты. Для следующих четырех байтов 10011011, 11011001, 00010011, 10100111 (половинки которых можно обозначить шестнадцатеричными цифрами: 9В, D9, 13, А7) получим при этом следующий полином: 9Вх3+D9x2+13х 1+А7.

Набор байтов, таким образом, рассматривается как набор коэффициентов многочлена. В существующем решении вычисления в каждом байте производятся независимо, тогда как в нашем случае набор отдельных байтов объединяется в многочлен и вычисления по формулам (1)-(4) теперь производятся не с каждым байтом по отдельности, а целиком со всем набором. При этом, как и в существующем решении, самыми часто употребимыми операциями являются умножение на многочлен х и деление на «порождающий» многочлен. В случае, если порождающий многочлен является разреженным (то есть имеющим большое количество нулевых коэффициентов) количество необходимых вычислений с коэффициентами оказывается намного меньшим, чем в существующем решении.

В качестве «порождающего» многочлена используется многочлен, не обладающий свойством неразложимости. При этом данный многочлен порождает не поле, а другую структуру, именуемую кольцом. Существенное отличие кольца от поля состоит в том, что в кольце не на все элементы можно делить. Но требование делимости на все элементы является избыточным. В соответствии с формулой (3) достаточно иметь возможность осуществлять деление только на некоторые элементы. Например, уже упоминавшийся многочлен

x128+x7+x2+х+1

имеет 124 нулевых коэффициента, 5 единичных и больше никаких. Нахождение остатка от деления на этот многочлен сводится к выполнению всего четырех операций сложения и позволяет «обработать» этими четырьмя сложениями 128 байт.

Итак, способ восстановления записей в запоминающем устройстве согласно настоящему изобретению осуществляется следующим образом.

В запоминающем устройстве область памяти разделяют на информационные зоны и контрольные зоны. Запоминающее устройство может быть, например, дисковым массивом, построенным по технологии RAID-6, тогда каждая из информационных и контрольных зон представляет собой отдельный диск. В случае, когда запоминающее устройство выполнено по-другому - например, по технологии флэш-памяти, - информационные и контрольные зоны могут быть выделены в общем объеме этой памяти. Важно лишь, чтобы информационные и контрольные зоны имели каждая одинаковый объем памяти и несовпадающие адреса в каждой из этих зон для соответствующих ячеек.

Разумеется, все информационные и контрольные зоны соединены между собой и работают под управлением одного и того же контроллера (или иного управляющего средства), который как раз и обеспечивает все последующие операции данного способа. Этот контроллер именуется далее (в том числе и в формуле изобретения) вычислительным блоком.

В соответствующую информационную зону записывают каждую группу подлежащих запоминанию данных в виде набора кодовых слов. Такие записи производят по мере поступления новых данных, как путем добавления записей в свободное место уже записанной информационной зоны, так и путем перезаписи всех данных, записанных в эту информационную зону. Эти записи могут осуществляться как автоматически (например, с заданным временным периодом), так и принудительно оператором.

При каждой очередной записи подлежащих запоминанию данных в упомянутое запоминающее устройство находят с помощью соответствующего вычислительного блока по меньшей мере две эталонных контрольных суммы. Каждая из этих эталонных контрольных сумм вычисляется по соответствующей заранее установленной формуле (например, по вышеуказанным формулам (1) и (2)) для каждого набора кодовых слов с одинаковыми номерами во всех информационных зонах. К примеру, две эталонные контрольные суммы вычисляются для всех первых ячеек во всех информационных зонах, еще две эталонные контрольные суммы вычисляются для всех вторых ячеек во всех информационных зонах (по тем же формулам, что и для первых ячеек) и так далее.

Каждую из найденных таким образом эталонных контрольных сумм записывают в виде кодового слова с тем же номером в соответствующую контрольную зону. В приведенном выше примере первую эталонную контрольную сумму (вычисленную, к примеру, по формуле (1)) для всех первых ячеек записывают в первую ячейку первой контрольной зоны, первую эталонную контрольную сумму для всех вторых ячеек записывают во вторую ячейку этой же первой контрольной зоны и т.д. А вот вторые эталонные контрольные суммы (вычисленные, в данном случае, по формуле (2)) для тех же ячеек записывают в ячейки с теми же номерами, но уже во вторую контрольную зону. Эти вычисления эталонных контрольных сумм производятся автоматически при каждой очередной записи в любую информационную зону.

В процессе использования запоминающего устройства неоднократно с помощью вычислительного блока вычисляют текущие контрольные суммы по заранее установленным формулам для каждого набора кодовых слов с одинаковыми номерами во всех информационных зонах. Т.е. при работе запоминающего устройства между очередными записями данных вычисляют - либо периодически, либо принудительно - текущие контрольные суммы. Для этого используют те же самые заранее установленные формулы (например, формулы (1) и (2)).

Далее каждую из вычисленных текущих контрольных сумм сравнивают с помощью того же вычислительного блока с соответствующей эталонной контрольной суммой для набора кодовых слов с теми же номерами, записанной в соответствующую контрольную зону, для определения синдрома ошибок.

Если синдром оказывается нулевым, что свидетельствует об отсутствии ошибок или сбоев, работу запоминающего устройства продолжают по-прежнему.

Если же при таком сравнении определено, что синдром ошибок имеет ненулевое значение, найденные по этому синдрому ошибки заменяют записи правильными значениями. Такое исправление ошибок является общеизвестным для специалистов в области кодирования с исправлением ошибок.

Отличие данного способа от известных состоит в том, что выявление ошибок записи с использованием ненулевого синдрома производят с помощью вычислительного блока путем соответствующих вычислений над многочленами, в которых в качестве коэффициентов используют кодовые слова с одинаковыми номерами во всех информационных зонах, а в качестве порождающего многочлена, по модулю которого производят соответствующие вычисления над этими многочленами, используют такой многочлен, который не обладает свойством неразложимости на множители и порождает конечное кольцо. Конкретные пояснения последнего действия приведены ранее.

Можно отметить, что вычислительный блок может входить в состав запоминающего устройства, т.е. быть его составной частью, но может быть и внешним средством по отношению к этому запоминающему устройству, например, в случаях, когда запоминающее устройство организовано в процессе работы из нескольких самостоятельных устройств. Так, внешнее средство в данном случае может быть сетевым сервером, управляющим работой нескольких баз данных, соединенных обслуживаемой им сетью.

Следует в заключение отметить, что по приведенному здесь описанию специалист может составить соответствующую программу, при исполнении которой в компьютере будут осуществляться действия способа по настоящему изобретению. Поэтому машиночитаемый носитель с такой программой, предназначенный для непосредственного участия в работе компьютера, является одним из объектов настоящего изобретения.

Еще одним объектом настоящего изобретения является система, содержащая вышеописанное запоминающее устройство и вычислительный блок, обеспечивающий описанное выше функционирование.

Можно добавить, что для ускорения вычислений по формуле (6) полезно заранее подготовить набор величин для gx-1 и (1+g y-x), где х, y=0, способ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 , n-1, хспособ восстановления записей в запоминающем устройстве, система   для его осуществления и машиночитаемый носитель, патент № 2448361 y. Основных результатов можно достичь при организации параллельных вычислений, поскольку предложенный способ подразумевает большое количество сложений независимых данных любого размера.

Класс G06F12/16 защита от потерь данных в памяти

способ восстановления данных в системе управления базами данных -  патент 2526753 (27.08.2014)
система и способ обнаружения вредоносных объектов, распространяемых через пиринговые сети -  патент 2487406 (10.07.2013)
поэтапная, облегченная система резервного копирования -  патент 2483349 (27.05.2013)
программатор -  патент 2470389 (20.12.2012)
самоуправляемое обрабатывающее устройство -  патент 2461053 (10.09.2012)
способ определения ошибочного использования памяти -  патент 2458386 (10.08.2012)
способ адаптивного управления пакетом антивирусных сканеров и система для его осуществления -  патент 2457533 (27.07.2012)
система и способ для антивирусной проверки на стороне сервера скачиваемых из сети данных -  патент 2449348 (27.04.2012)
электромеханическое устройство защиты информации, размещенной на цифровом накопителе, от несанкционированного доступа -  патент 2448360 (20.04.2012)
способ предотвращения обратного инжиниринга программного обеспечения, неавторизованной модификации и перехвата данных во время выполнения -  патент 2439669 (10.01.2012)

Класс G11C29/52 защита содержимого памяти; обнаружение ошибок в содержимом памяти

Наверх