множительное устройство

Классы МПК:	G06F7/52 для умножения; для деления
Автор(ы):	Семеренко В.П., Днепровский В.И.
Патентообладатель(и):	Винницкий политехнический институт
Приоритеты:	подача заявки: 1992-01-31 публикация патента: 30.10.1994

Изобретение относится к вычислительной технике и может быть применено при построении арифметических устройств высокопроизводительных ЭВМ. Целью изобретения является расширение функциональных возможностей устройства за счет того, что оно работает как в режиме умножения, так и в режиме сложения, упрощение процедур наращиваемости устройства и взаимозаменяемости его блоков. Устройство может работать как три независимых n-разрядных накапливающих сумматора или три независимых n разрядных умножителя. В режиме умножения (сложения) в регистры 1-3 записываются множимые (слагаемые), а в регистры 4-6 - множитель (единичный вектор). Затем операнды через группы элементов И 7-9, блоки 10-12 задержки и n блоков 13 мультиплексоров поступают на первую группу n систолических полусумматоров 14 и на вторую группу n систолических полусумматоров 15, где происходит вычисление искомых сумм и произведений. Суммы и произведения в устройстве вычисляются путем выполнения операций над кубическими покрытиями функции переносов и функции суммы, которые ранее, в режиме программирования, записываются соответственно в первую 14 и вторую 15 группы систолических полусумматоров. 3 з.п. ф., 1 табл., 9 ил.

Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6, Рисунок 7, Рисунок 8, Рисунок 9, Рисунок 10

Формула изобретения

1. МНОЖИТЕЛЬНОЕ УСТРОЙСТВО, содержащее три регистра множителя и три регистра множимого, причем n информационных входов первой и второй групп устройства соединены соответственно с n информационными входами первых регистров множимого и множителя (где n-разрядность операндов), отличающееся тем, что в него введены две группы по n систолических полусумматоров, n блоков мультиплексоров, три блока задержки и три группы по n элементов И, причем первые входы элементов и h-й группы соединены с выходами h-го регистра множимого (h = 1 множительное устройство, патент № 2022339

множительное устройство, патент № 2022339

3), вторые входы элементов И h-й группы соединены с выходом h-го регистра множителя, выходы элементов И h-й группы соединены с информационными входами h-го блока задержки, n информационных входов первой группы устройства соединены с n информационными входами второго и третьего регистров множимого, n информационных входов второй группы устройства соединены с n информационными входами второго и третьего регистров множителя, три информационных входа третьей группы устройства соединены соответственно с тремя информационными входами первой группы первого блока мультиплексоров, четыре информационных входа четвертой и пятой групп устройства соединены с четырьмя первыми информационными входами первых систолических полусумматоров первой и второй групп соответственно, три выхода i-го блока мультиплексоров (i = 1, n) соединены соответственно с тремя вторыми информационными входами i-х систолических полусумматоров первой и второй групп, четыре информационных выхода первой группы j-х систолических полусумматоров первой и второй групп соединены соответственно с четырьмя первыми информационными входами (j + 1)-х систолических полусумматоров первой и второй групп (j = 1 ..., n - 1), три информационных выхода второй группы i-го систолического полусумматора второй группы соединены соответственно с тремя информационными входами второй группы i-го блока мультиплексоров и тремя выходами суммы i-й группы устройства, три информационных выхода второй группы (j + 1)-го систолического полусумматора второй группы соединены соответственно с тремя информационными входами третьей группы j-го блока мультиплексоров, три информационных выхода второй группы i-го систолического полусумматора первой группы соединены соответственно с тремя информационными входами четвертой группы i-го блока мультиплексоров и тремя информационными входами первой группы (j + 1)-го блока мультиплексоров, три информационных выхода второй группы n-го систолического полусумматора первой группы соединены соответственно с тремя выходами переноса группы устройства, i-й выход h-го блока задержки соединены с h-м информационным входом пятой группы i-го блока мультиплексоров, h-й тактовый вход первой группы устройства соединен соответственно с тактовым входом h-го регистра множимого и первым тактовым входом h-го регистра множителя, второй тактовый вход которого соединен с (h + 3)-м тактовым входом первой группы устройства, (h + 6)-й тактовый вход первой группы которого соединен с тактовым входом h-го блока задержки, тактовые входы с первого по шестой второй группы устройства соединены с тактовыми входами с первого по шестой каждого систолического полусумматора первой и второй групп, третий тактовый вход второй группы устройства соединен с тактовыми входом i-го блока мультиплексора, вход установки которого соединен с первым входом установки группы устройства, первый управляющий вход которого соединен с управляющими входами i-х систолических полусумматоров первой и второй групп, второй управляющий вход устройства соединен с управляющим входом i-го блока мультиплексоров, h-й вход установки группы устройства соединен соответственно с h-м входом установки группы i-х систолических полусумматоров первой и второй групп.

2. Устройство по п.1, отличающееся тем, что каждый систолический полусумматор первой и второй групп содержит матрицу из (3 множительное устройство, патент № 2022339

4) вычислительных ячеек, каждая из которых состоит из двух D-триггеров и элемента неравнозначности, три элемента свертки, четыре коммутатора и элемент НЕ, выход которого соединен с первым управляющим входом j-го коммутатора (j = 1, 2, 3, 4), выход которого соединен с первым информационным входом (1, j)-й вычислительной ячейки матрицы, первый информационный выход (i, j)-й вычислительной ячейки матрицы (i = 1, 2) соединен с первым информационным входом (i + 1, j)-й вычислительной ячейки матрицы, первый информационный выход (3, j)-й вычислительной ячейки соединен с j-м информационным выходом первой группы полусумматора и первым информационным входом j-го коммутатора, второй управляющий вход которого соединен с входом элемента НЕ и управляющим входом полусумматора, j-й информационный вход первой группы которого соединен с вторым информационным входом j-го коммутатора, K-й информационный вход второй группы полусумматора (K = 1, 2, 3) соединен с вторым информационным входом каждой (K, j)-й вычислительной ячейки матрицы, второй информационный выход которой соединен с j-м информационным входом K-го элемента свертки, выход которого соединен с K-м информационным выходом второй группы полусумматора, K-й вход установки группы которого соединен с входом установки K-го элемента свертки, первый тактовый вход полусумматора соединен с тактовым входом каждой (K, j)-й вычислительной ячейки матрицы, второй и третий тактовые входы полусумматора соединены соответственно с первым и вторым тактовыми входами K-го элемента свертки, третий тактовый вход которого соединен с (K + 3)-м тактовым входом полусумматора, в каждой (K, j)-й вычислительной ячейке первый и второй информационные входы ячейки соединены с информационными входами первого и второго D-триггеров соответственно, прямые выходы которых соединены соответственно с первым и вторым входами элемента неравнозначности, выход которого соединен с вторым информационным выходом ячейки, первый информационный выход которой соединен с прямым выходом первого D-триггера, синхровход которого соединен с синхровходом второго D-триггера и тактовым входом ячейки, а каждый элемент свертки состоит из четырех RST-триггеров, элемента ИЛИ и D-триггера, прямой выход которого соединен с выходом элемента свертки, вход установки которого соединен с входом установки D-триггера, D-вход которого соединен с выходом элемента ИЛИ, входы которого соединены с инверсными выходами R S T-триггеров, S-входы которых соединены соответственно с четырьмя информационными входами элемента свертки, три тактовых входа которого соединены соответственно с T-входами R S T-триггеров, с синхровходом D-триггера и с R-входами R S T-триггеров.

3. Устройство по п.1, отличающееся тем, что каждый блок задержки содержит треугольную матрицу из (i, j) D-триггеров, причем каждая i-я строка и (n - i + 1)-й столбец матрицы содержит i D-триггеров (i = j = 1, ... n), i-й информационный вход блока соединен с информационным входом (i, 1)-го D-триггера матрицы, прямой выход (i, j)-го D-триггера матрицы, кроме прямых выходов последних D-триггеров в каждой строке, соединен с информационным входом (i, j + 1)-го D-триггера матрицы, прямой выход последнего D-триггера каждой i-й строки матрицы соединен с i-м выходом блока, тактовый вход которого соединен с синхровходом всех D-триггеров.

4. Устройство по п.1, отличающееся тем, что каждый блок мультиплексоров содержит кольцевой распределитель импульсов, элемент НЕ и три мультиплексора, каждый из которых состоит из шести элементов И и элемента ИЛИ, причем первый выход распределителя импульсов соединен с первыми входами (2 : h - 1)- и (2 множительное устройство, патент № 2022339

h)-го элементов И h-го мультиплексора (h = 1 множительное устройство, патент № 2022339

3), второй выход распределителя импульсов соединен с первыми входами (2 множительное устройство, патент № 2022339

h + 1)- и (2 множительное устройство, патент № 2022339

h + 2)-го элементов И h-го мультиплексора (h = 1, 2) и первыми входами первого и второго элементов И третьего мультиплексора, третий выход распределителя импульсов соединен с первыми входами (6 - 2 множительное устройство, патент № 2022339

h + 1)- и (6 - 2 множительное устройство, патент № 2022339

h + 2)-го элементов И h-го мультиплексора (h = 1 множительное устройство, патент № 2022339

3), выход элемента НЕ соединен с вторыми входами первого, третьего и пятого элементов И в каждом мультиплексоре, вход элемента НЕ соединен с управляющим входом блока и вторыми входами второго, четвертого и шестого элементов И каждого мультиплексора, три информационных входа первой группы блока соединены соответственно с третьими входами пятого элемента И в каждом мультиплексоре, три информационных входа второй группы блока соединены соответственно с третьими входами первого элемента И в каждом мультиплексоре, три информационных входа третьей группы блока соединены соответственно с третьими входами четвертого элемента И в каждом мультиплексоре, три информационных входа четвертой группы блока соединены соответственно с третьими входами второго элемента И в каждом мультиплексоре, три информационных входа пятой группы блока соединены соответственно с третьими входами третьего и шестого элементов И в каждом мультиплексоре, выходы И с первого по шестой h-го мультиплексора соединены с соответствующими входами h-го элемента ИЛИ, выходы элементов ИЛИ соединены соответственно с тремя информационными выходами блока, вход установки и тактовый вход которого соединены соответственно с первым и вторым входами распределителя импульсов.

Описание изобретения к патенту

Изобретение относится к вычислительной технике и может быть применено при построении арифметических устройств высокопроизводительных ЭВМ.

Целью изобретения является расширение функциональных возможностей устройства за счет того, что оно работает как в режиме умножения, так и в режиме сложения, упрощение процедур наращиваемости устройства и взаимозаменяемости его блоков.

В основу работы устройства заложен систолический способ умножения методом поэтапного сложения сдвигаемых на один разряд вправо множителя и частичных сумм произведения. В устройстве выполняемая комбинационной схемой функция интерпретируется как установление принадлежности входного набора аргументов булевой функции множеству наборов, на которых эта функция принимает значение логической "1" или логического "0". Установление принадлежности входного набора аргументов указанному множеству наборов выполняется с помощью операции пересечения над кубами покрытий функций суммы и функции переноса одноразрядного комбинационного сумматора. Разбиение всего процесса вычисления булевых функций суммы и переноса на элементарные, независимые друг от друга операции позволило организовать в устройстве конвейерную и матричную обработку данных с минимальным по времени тактом работы. В устройстве перед началом работы в ячейки систолических полусумматоров необходимо записать кубические покрытия функций суммы и функций переноса.

На фиг. 1 представлена функциональная схема множительного устройства; на фиг. 2 - функциональная схема одноразрядного систолического полусумматора; на фиг. 3 - схема блока задержки; на фиг. 4 - схема блока мультиплексоров; на фиг. 5 - схема вычислительной ячейки; на фиг. 6 - схема элемента свертки; на фиг. 7 - схема коммутатора; на фиг. 8 - временная диаграмма тактовых сигналов первой группы в режиме сложения; на фиг. 9 - временная диаграмма тактовых сигналов второй группы устройства.

Устройство (фиг. 1) содержит регистры 1-3 множимого, регистры 4-6 множителя, три группы элементов И 7-9, три блока 10-12 задержки, группу из n блоков 13 мультиплексоров, первую группу из n систолических полусумматоров 14, вторую группу из n систолических полусумматоров 15, первую группу из n информационных входов 16 устройства, вторую группу из n информационных входов 17 устройства, третью группу из трех информационных входов 18 устройства, четвертую группу из четырех информационных входов 19 устройства, пятую группу из четырех информационных входов 20 устройства, первый управляющий вход 21 устройства, второй управляющий вход 22 устройства, группу из трех входов 23 установки устройства, первую группу из девяти тактовых входов 24 устройства, вторую группу из шести тактовых входов 25 устройства, n групп по три выхода 26 суммы устройства, группу из трех выходов 27 переноса устройства, первую группу из четырех информационных входов 28 систолических полусумматоров 14, 15, вторую группу из трех информационных входов 29 систолических полусумматоров 14, 15, управляющий вход 30 систолических полусумматоров 14, 15, группу из трех входов 31 установки систолических полусумматоров 14, 15, группу из шести тактовых входов 32 систолических полусумматоров 14, 15, первую группу из четырех информационных выходов 33 систолических полусумматоров 14, 15, вторую группу из трех информационных выходов 34 систолических полусумматоров 14, 15, группу из n информационных входов 35 блоков 10-12 задержки, тактовый вход 36 блоков 10-12 задержки, группу из n информационных выходов 37 блоков 10-12 задержки, первую группу из трех информационных входов 38 блоков 13 мультиплексоров, вторую группу из трех информационных входов 39 блоков 13 мультиплексоров, третью группу трех информационных входов 40 блоков 13 мультиплексоров, четвертую группу из трех информационных входов 41 блоков 13 мультиплексоров, пятую группу из трех информационных входов 42-44 блоков 13 мультиплексоров, управляющий вход 45 блоков 13 мультиплексоров, установочный вход 46 блоков 13 мультиплексоров, тактовый вход 47 блоков 13 мультиплексоров и группу из трех информационных выходов 48 блоков 13 мультиплексоров.

Первая и вторая группы n систолических полусумматоров 14, 15 образуют три n-разрядных систолических сумматора с поразрядным последовательным переносом. Систолические сумматоры 14, 15 (фиг. 2) имеют одинаковую структуру и содержат матрицу 3х4 вычислительных ячеек 49, три элемента 50 свертки, четыре коммутатора 51, элемент НЕ 52, первый информационный вход 53 вычислительной ячейки 49, второй информационный вход 54 вычислительной ячейки 49, тактовый вход 55 вычислительной ячейки 49, первый информационный выход 56 вычислительной ячейки 49, второй информационный выход 57 вычислительной ячейки 49, группу из четырех информационных входов 58 элементов 50 свертки, установочный вход 59 элементов 50 свертки, первый тактовый вход 60 элементов 50 свертки, второй тактовый вход 61 элементов 50 свертки, третий тактовый вход 62 элементов 50 свертки, выход 63 результата элементов 50 свертки, входы 64-67 коммутаторов 51, выход 68 коммутаторов 51.

Блоки 10-12 задержки (фиг. 3) имеют одинаковую структуру и содержат m D-триггеров 69:

m= множительное устройство, патент № 2022339

i

Блок 13 мультиплексоров (фиг. 4) содержит кольцевой распределитель 70 импульсов, элемент НЕ 71, три группы по шесть элементов И 72-74, три элемента ИЛИ 75-77. Три группы элементов И и соответствующие элементы ИЛИ в каждом блоке 13 мультиплексоров образуют три мультиплексора, которые работают от единого кольцевого распределителя импульсов.

Вычислительная ячейка 49 предназначена для выполнения элементарной операции пересечения компоненты входного набора аргументов с компонентой одного куба кубического покрытия функции переноса (в первой группе систолических полусумматоров 14) или функции суммы (во второй группе систолических полусумматоров 15). Вычислительная (фиг. 5) ячейка 49 содержит D-триггеры 78, 79 и элемент 80 неравнозначности.

Элемент 50 свертки предназначен для формирования результата пересечения входного набора аргументов с кубическим покрытием функции переноса (в первой группе систолических полусумматоров 14) или функции суммы (во второй группе систолических полусумматоров 15). Элемент 50 свертки (фиг. 6) содержит четыре RST-триггера 81-84, элемент ИЛИ 85 и D-триггер 86.

Коммутатор 51 (фиг. 7) содержит элементы И 87, 88 и элемент ИЛИ 89.

Устройство работает в трех режимах: режиме программирования, режиме сложения и режиме умножения.

В режиме программирования производится запись в устройство кубических покрытий, которые определяют функционирование устройства в остальных режимах работы.

В режимах сложения и умножения искомые суммы и произведения вычисляются путем выполнения операций над кубическими покрытиями (D-покрытиями или R-покрытиями) функции переносов (в первой группе систолических полусумматоров 14) и функции суммы (во второй группе систолических полусумматоров 15). D-покрытие (R-покрытие) некоторой булевой функции f - это представленная в кубической форме минимальная дизьюнктивная нормальная форма (МДНФ) прямой функции f (инверсной функции множительное устройство, патент № 2022339

). МДНФ прямой функции f (инверсной функции множительное устройство, патент № 2022339

) содержит все наборы, на которых функция f принимает значение логической "1" (логического "0"). D-покрытие (R-покрытие) состоит из кубов, количество которых равно количеству импликант МДНФ прямой функции f (инверсной функции множительное устройство, патент № 2022339

). Количество компонент куба равно количеству переменных МДНФ, а значениями компонент куба могут быть только три символа 0, 1, Х, где Х = {0, 1}. Каждый куб d (r) соответствует одной импликанте МДНФ прямой функции f (инверсной функции множительное устройство, патент № 2022339

) таким образом, что единичное (нулевое) значение компоненты куба соответствует прямому (инверсному) значению переменной в импликанте МДНФ (d множительное устройство, патент № 2022339

D, r

R).

Каждое из покрытий (D-покрытие или R-покрытие) однозначно определяет функционирование комбинационной схемы, поэтому используется только одно из них, а именно то покрытие, которое содержит меньшее количество кубов. В дальнейшем для простоты изложения рассматриваются только D-покрытия.

Например, n-разрядный комбинационный сумматор может быть представлен в виде n взаимосвязанных одноразрядных сумматоров. Функционирование i-го одноразрядного сумматора может быть описано с помощью функции переноса f_п¹ и функции суммы f_c¹ следующего вида:

множительное устройство, патент № 2022339

b_ip_i-1

p_i-1

a_ib

a_ib_ip_i-1 (1)

f множительное устройство, патент № 2022339

a_ib

a_ib_ip_i-1 где a_i, b_i - слагаемые в i-м разряде;

p_i-1 - перенос из (i-1)-го разряда.

Кубические покрытия переноса (D_п¹-покрытие) и суммы (D_с¹ - покрытие) функций (1) имеют вид

D множительное устройство, патент № 2022339

Поскольку операция умножения чисел с фиксированной запятой может быть сведена к операциям сложения и сдвига, поэтому n-разрядный умножитель может быть выполнен на основе n-разрядного накапливающего сумматора. Накапливающий сумматор содержит память для хранения суммы в течение нескольких этапов суммирования, и поэтому представляет собой конечный автомат.

С помощью кубических покрытий можно определить функционирование также и конечного автомата, если представить его в виде схемы, состоящей из двух частей: комбинационной части и памяти. Комбинационная часть i-го одноразрядного накапливающего сумматора может быть описана с помощью функции переноса f_п"" и функции суммы f_c"" следующего вида:

множительное устройство, патент № 2022339

s_ip_i-1

p_i-1

a_is

a_is_ip_i-1

f множительное устройство, патент № 2022339

a_is

a_is_ip_i-1 (2) где S_i - значение выхода элемента памяти i-го одноразрядного накапливающего сумматора, сохраняющего ранее накопленную сумму.

Кубические покрытия переноса (D_п""-покрытия) и суммы (D_c""-покрытия) функции (2) имеют вид

D множительное устройство, патент № 2022339

(3)

Перед началом работы устройства исходные покрытия (3) преобразуются в транспонированную форму и в режиме программирования записываются в первую 14 и вторую 15 группы систолических полусумматоров. Если после режима программирования следует режим сложения, тогда процесс преобразования покрытий (3) происходит следующим образом.

D_п"" - покрытие вначале представляется в виде

D множительное устройство, патент № 2022339

и затем транспонируется аналогично известной операции транспонирования матриц. В итоге получают D_п^сл-покрытие вида

D^с_п^л= множительное устройство, патент № 2022339

(4) D_c""-покрытие вначале представляется в виде

D множительное устройство, патент № 2022339

и затем транспонируется. В итоге получают D_c^сл-покрытие вида

D^с_c^л= множительное устройство, патент № 2022339

(5)

Далее покрытие (4) записывается в первую группу систолических полусумматоров 14, а покрытие (5) - во вторую группу систолических полусумматоров 15.

В режиме программирования на первый управляющий вход 21 поступает сигнал логической "1", который разрешает прохождение информации между соседними парами систолических полусумматоров 14, 15.

В течение 3 множительное устройство, патент № 2022339

n тактов через четвертую группу четырех информационных входов 19 поступает n D_п^сл-покрытий построчно, начиная с первой строки (первого куба). Одновременно в течение 3 множительное устройство, патент № 2022339

n тактов через пятую группу четырех информационных входов 20 поступает n D_c^сл-покрытий также построчно.

В каждом такте поступает очередная строка указанных покрытий и путем сдвига информация продвигается по систолической полусумматорам 14, 15. В конце режима программирования в каждом из систолических полусумматоров 14, 15 записано соответственно D_п^сл-покрытие и D_c^сл-покрытие.

Если после режима программирования следует режим умножения, то процесс преобразования кубических покрытий и запись их в устройство происходит следующим образом.

D_п""-покрытие вначале представляется в виде

D множительное устройство, патент № 2022339

и затем транспонируется. В итоге получают D_п^умн-покрытие вида

D^у_п^мн = множительное устройство, патент № 2022339

(6)

D_c""-покрытие вначале представляется в виде

D множительное устройство, патент № 2022339

и затем транспонируется. В итоге получают D_c^умн-покрытие вида

D^у_c^мн = множительное устройство, патент № 2022339

(7)

Далее аналогично в течение 3 множительное устройство, патент № 2022339

n тактов n D_n^умн-покрытий записываются в первую группу систолических полусумматоров 14, а n D_c^умн-покрытий - во вторую группу систолических полусумматоров 15.

По окончании записи кубических покрытий на первый управляющий вход 21 поступает сигнал логического "0", который запрещает прохождение информации между соседними парами систолических полусумматоров 14, 15.

В режиме сложения, который устанавливается подачей сигнала логического "0" на второй управляющий вход 22, устройство работает как три независимых n-разрядных накапливающих сумматора. Сложение в устройстве происходит путем выполнения ряда операций над покрытиями (4) и (5), ранее записанными в соответствующие систолические полусумматоры 14, 15. Этот процесс осуществляется по циклам, каждый из которых состоит из трех тактов.

При подаче сигнала логической "1" на установочный вход 23 устройство устанавливается в исходное, нулевое состояние.

На первую группу n информационных входов 16 в первом такте каждого цикла поступает n-разрядное число, которое записывается в один из регистров 1-3. Каждый из регистров 1-3 является входным регистром для соответствующего накапливающего сумматора. Согласно временной диаграмме (фиг. 8) в один и тот же регистр 1-3 новое число поступает через каждые два цикла. Таким образом, на первую группу n информационных входов 16 поочередно поступают слагаемые на все три накапливающих сумматора. Одновременно на вторую группу n информационных входов 17 каждый цикл поступает число, состоящее из единиц, которое записывается в регистры 4-6.

Информация из регистров 1-3 проходит через соответствующую группу элементов И 7-9 и во втором такте каждого третьего цикла записывается в соответствующий блок 10-12 задержки. С помощью блоков 10-12 задержки осуществляется задержка i-го разряда слагаемого на i циклов (i = 1-n).

Далее в третьем такте каждого цикла открывается путь прохождения информации из блоков 10-12 задержки через группу блоков 13 мультиплексоров. Через i-ю группу блоков 13 мультиплексоров поочередно проходят i-е разряды слагаемых и в первом такте следующего цикла поступают на i-е систолические полусумматоры 14, 15. В итоге i-й разряд К-го слагаемого поступает на i-й разряд R-го систолического накапливающего сумматора, и в течение трех циклов в i-м систолическом полусумматоре 14 происходит вычисление i-го разряда переноса P_i^h(k), а в i-м систолическом полусумматоре 15 - вычисление i-го разряда суммы S_i^h(k), где

h = множительное устройство, патент № 2022339

_, ^h=1-3.

Значения переноса Р_i^h(k) и суммы S_i^h(k) появляются на h-х выходах второй группы трех информационных выходов 34 i-х систолических полусумматоров 14 и 15 в третьем такте третьего цикла после поступления i-го разряда К-го слагаемого на h-е входы второй группы трех информационных входов 29 i-х систолических полусумматоров 14 и1 5.

Значение переноса P_i^h(k) в следующем цикле поступает через (i+1)-й блок 13 мультиплексоров на h-е входы второй группы трех информационных входов 29 (i+1)-х систолических полусумматоров 14, 15. Значение суммы S_i^h(k) в следующем цикле поступает через i-й блок 13 мультиплексоров на h-е входы второй группы трех информационных входов 29 i-х систолических полусумматоров 14 и 15. В итоге происходит прибавление к предыдущему содержимому каждого сумматора нового слагаемого.

Поскольку i-й разряд К-го слагаемого поступает на i-й разряд h-го сумматора со сдвигом во времени на один цикл относительно поступления (i-1)-го разряда на (i-1)-й разряд h-го сумматора, поэтому в третьем такте каждого цикла, начиная с третьего цикла после поступления первого разряда К-го слагаемого, на h-х выходах второй группы трех информационных выходов 34 первой и второй групп систолических полусумматоров 14 и 15 поочередно появляются значения переноса P_i^h(k) и суммы S_i^h(k) К-го слагаемого.

На входы второй группы трех информационных входов 29 i-х систолических полусумматоров 14 и 15 i-е разряды трех слагаемых тоже поступают со сдвигом во времени на один цикл относительно друг друга. Поэтому значения переноса P_i^h(k+1) и суммы S_i^h(k+1) появляются на (h+1)-х выходах второй группы трех информационных выходов 34 i-х систолических полусумматоров 14 и 15 со сдвигом во времени на один цикл относительно появления значений переноса P_i^h(k) и суммы S_i^h(k) на h-х выходах второй группы трех информационных выходов 34 i-х систолических полусумматоров 14 и 15.

Таким образом в устройстве реализован конвейерный и матричный принципы сложения, т. е. по окончании вычисления значений переноса P_i^h(k)и суммы S_i^h(k) на входы i-х систолических полусумматоров 14 и 15 поступают i-е разряды очередного, (К+3)-го слагаемого, причем в устройстве происходит одновременное сложение трех независимых друг от друга последовательностей слагаемых.

В режиме умножения, который устанавливается подачей сигнала логической "1" на второй управляющий вход 22, устройство работает как три независимых n-разрядных устройства умножения с фиксированной запятой. В устройстве реализован способ умножения, начиная с младших разрядов множимого, со сдвигом вправо множителя и частичных сумм произведения.

На первую группу h информационных входов 16 в первом такте в течение трех циклов поступают три n-разрядных множимых, каждое из которых записывается в один из регистров 1-3 согласно временной диаграмме (фиг. 8). Одновременно на вторую группу n информационных входов 17 в первом такте в течение трех циклов поступают три n-разрядных множителя, каждый из которых записывается в один из регистров 4-6.

Следующая пара сомножителей поступает в регистры 1-6 через 3 множительное устройство, патент № 2022339

n циклов. Так как интервал между поступлениями пар сомножителей в устройстве составляет 3 множительное устройство, патент № 2022339

n циклов, поэтому тактовые сигналы по первым трем входам первой группы девяти тактовых входов 24 поступают с периодом 3 множительное устройство, патент № 2022339

n циклов, а тактовые сигналы по остальным входам этой группы входов поступают с таким же периодом, как и в режиме сложения согласно временной диаграммы (фиг. 8).

Поскольку умножение каждой пары сомножителей осуществляется в устройстве одинаково, поэтому в дальнейшем рассматривается операция умножения только для множимого А = а_n...а₁ и множителя В = b_n...b₁, которые записываются соответственно в регистр 1 и в регистр 4.

Если младший разряд b₁ множителя В равен единице, то содержимое регистра 1 передается через группу элементов И 7 и во втором такте первого цикла записывается в блок 10 задержки. Если разряд b₁ равен нулю, то в блок 10 задержки записываются все нули.

В третьем такте этого цикла происходит сдвиг вправо (в сторону младших разрядов) содержимого регистра 4 и теперь разряд b₂ множителя В разрешает или запрещает через два цикла передачу множимого А через группу элементов И 7.

Аналогично в течение 3 множительное устройство, патент № 2022339

n циклов происходит сдвиг вправо содержимого регистра 4 и в блок 10 задержки записывается либо множимое А, либо нулевой вектор в зависимости от значений разрядов множителя В. Как и в режиме сложения, в блоке 10 задержки осуществляется задержка i-го разряда множимого А на i циклов (i = 1,..., n).

Далее в третьем такте каждого цикла открывается путь прохождения информации от блока 10 задержки через группу n блоков 13 мультиплексоров. Через i-ю группу блоков 13 мультиплексоров проходит разряд а_i множимого и в первом такте следующего цикла поступает на i-е систолические полусумматоры 14 и 15.

Начиная с третьего цикла после начала поступления первого разряда а₁ множимого и в течение последующих 3 множительное устройство, патент № 2022339

(n-1) циклов на первых выходах второй группы трех информационных выходов 34 первый и второй групп n систолических полусумматоров 14 и 15 формируется первая частичная сумма произведения:

S¹⁽¹⁾ = S₁¹⁽¹⁾ S₂¹⁽¹⁾,..., S_i¹⁽¹⁾,..., S_n¹⁽¹⁾, которая получается путем сложения множимого А или нулевого вектора и начального нулевого состояния устройства:

S¹_i⁽¹⁾ = множительное устройство, патент № 2022339

i=1-n

Начиная с третьего цикла после начала поступления второго разряда а₂ множимого и в течение последующих 3 множительное устройство, патент № 2022339

(n-1) циклов на первых выходах второй группы информационных выходов 34 первой и второй групп n систолических полусумматоров 14 и1 5 формируется (n+1)-разрядная вторая частичная сумма:

S¹⁽²⁾ = S₁¹⁽²⁾, S₂¹⁽²⁾,..., S_i^1(2),..., S_n¹⁽²⁾, S_n+1¹⁽²⁾, которая получается путем сложения множимого А или нулевого вектора со сдвинутой на один разряд вправо первой частичной суммой S¹⁽¹⁾произведения:

S¹⁽²_i+1⁾ = множительное устройство, патент № 2022339

i=1-n-1

Поскольку младший разряд S₁¹⁽²⁾ второй частичной суммы S¹⁽²⁾вычислять не требуется, поэтому на первых выходах второй группы трех информационных выходов 34 первой и второй групп n систолических полусумматоров 14 и 15 формируется лишь n старших разрядов этой частичной суммы.

По аналогичному принципу формируется (n + j - 1)-разрядная j-я частичная сумма S^1(j): на первых выходах второй группы трех информационных выходов 34 первой и второй групп n систолических полусумматоров 14 и 15 формируется лишь n старших разрядов этой частичной суммы, а ее младшие разряды сдвигаются вправо на один разряд в каждом цикле (j = 1-n).

Одновременно в устройстве происходит умножение еще двух пар сомножителей, которые записываются в регистры 2, 5 и 3, 6 и затем поступают соответственно на вторые и третьи входы второй группы трех информационных выходов 34 первой и второй групп n систолических полусумматоров 14 и 15.

Значения отдельных разрядов каждого произведения формируются со сдвигом во времени на один цикл относительно друг друга. Значения одноименных разрядов трех произведений также формируются со сдвигом во времени на один цикл относительно друг друга.

Таким образом, в устройстве реализован конвейерный и матричный принципы умножения, т. е. в одном умножителе происходит одновременное сложение всех частичных сумм произведения, а в устройстве в целом - одновременное умножение трех независимых друг от друга пар сомножителей.

Блок 13 мультиплексоров работает следующим образом.

Перед началом работы устройства все блоки 13 мультиплексоров устанавливаются в исходное состояние по приходе сигнала на установочный вход 46. В исходном состоянии в i-м блоке 13 мультиплексоров кольцевой распределитель 70 импульсов имеет на h-м (h = 1-3) выходе значение логической "1", а на остальных выходах - значение логического "0", где

h = множительное устройство, патент № 2022339

Во время работы устройства в третьем такте каждого цикла на тактовый вход 47 приходит сигнал и в результате импульс поочередно появляется на каждом из выходов кольцевого распределителя 70 импульсов.

В режиме сложения потенциал логического "0" на управляющем входе 45 разрешает прохождение информации на группу трех информационных выходов 48 поочередно от второй группы трех информационных входов 39, от пятой группы трех информационных входов 42-44 и от первой группы трех информационных входов 38.

В режиме умножения потенциал логической "1" на управляющем входе 45 разрешает прохождение информации на группу трех информационных выходов 48 поочередно от четвертой группы трех информационных входов 41, от третьей группы трех информационных входов 40 и от пятой группы трех информационных входов 42-44.

Три мультиплексора, каждый из которых образован группой из шести элементов И 72-74 и соответствующим элементом ИЛИ 75-77, коммутируют сигналы с одноименных групп информационных входов со сдвигом во времени на один цикл относительно друг друга.

Каждый из систолических полусумматоров первой 14 и второй 15 групп работают следующим образом.

В режиме программирования при наличии разрешающего сигнала (логической "1") на управляющем входе 30 происходит поступление кубических покрытий через первую группу четырех информационных входов 28.

В режимах сложения или умножения в i-х систолических полусумматорах 14 и 15 осуществляется вычисление функций (2) путем выполнения ряда операций над записанными ранее их кубическими покрытиями.

Традиционный метод вычисления бульевой функции f на входном наборе G ее аргументов с помощью комбинационной схемы можно интерпретировать как установление принадлежности входного набора G множеству наборов, на которых функция f принимает значение логической "1".

При использовании кубического представления булевых функций установление принадлежности входного набора G указанному множеству наборов может быть выполнено аналитически с помощью операции пересечения кубов. По определению операция пересечения куба а = а₁ а₂... а_n и куба множительное устройство, патент № 2022339

₁

₂...

_nобозначается как множительное устройство, патент № 2022339

и служит для выделения куба множительное устройство, патент № 2022339

₁

₂...

_n, являющегося общей частью кубов а и множительное устройство, патент № 2022339

. Значение компоненты множительное устройство, патент № 2022339

_iопределяется по таблице, как множительное устройство, патент № 2022339

_i=a_i

_i(j=1-n).

Знак 0 означает пустое пересечение. Например, если

а = 1 х 1 х 01, множительное устройство, патент № 2022339

= х 01 101, то куб множительное устройство, патент № 2022339

равен

Входной набор G принадлежит множеству наборов, на которых булева функция f принимает значение логической "1" (логического "0", если имеет место непустое пересечение набора G хотя бы с одним кубом D-покрытия (пустое пересечение набора G со всеми кубами D-покрытия) этой функции.

Следовательно, значение функции переноса f_n"" (2) на h-м выходе второй группы трех информационных выходов 34 i-го систолического полусумматора 14 в режиме сложения при поступлении входного набора G_hможет быть определено следующим образом:

f множительное устройство, патент № 2022339

(Gⁱ_h) = множительное устройство, патент № 2022339

(8) где d^п множительное устройство, патент № 2022339

;

=1-4, h = 1-3.

Значение функции суммы f_c"" (2) на h-м выходе второй группы трех информационных выходов 34 i-го систолического полусумматора 15 в режиме сложения при поступлении входного набора G_hⁱ может быть определено следующим образом:

f множительное устройство, патент № 2022339

(Gⁱ_h) =

(9) где d^c множительное устройство, патент № 2022339

;

=1-4,h = 1-3.

Правила (8) и (9) справедливы также и для покрытий D_n^сл и D_с^сл.

Аналогично определяется в режиме умножения значение функции f_n""(f_c"") на h-м выходе второй группы трех информационных выходов 34 i-х систолических полусумматоров 14 и 15.

Отличительной особенностью выполнения операций над кубами является возможность одновременной и независимой обработки отдельных компонент кубов. Благодаря указанной особенности процесс выполнения операции пересечения входных наборов аргументов булевой функции с кубами кубического покрытия этой функции распараллеливается с помощью матрицы ячеек 49.

В режиме сложения последовательность k-разрядных входных наборов

G₁, G₂, G₃, . .., G_k,... образуется из трех независимых друг от друга последовательностей

G₁, G₄, G₇,..., G_k,...

G₂, G₅, G₈,..., G_k+1,... (10)

G₃, G₆, G₉,..., G_k+2,..., которые поступают на входы трех систолических сумматоров следующим образом.

На входы h-го систолического сумматора поступает входной набор

G_h = (G_h¹G_h²,..., G_hⁱ,..., G_hⁿ), где

h = множительное устройство, патент № 2022339

^h=1-3

На h-й вход второй группы трех информационных входов 29 i-х систолических полусумматоров 14 и 15 в i-м цикле работы устройства поступает набор

G_hⁱ = (p_i-^h₁^-3 a^h_i S^h_i^-3 ), начиная с компоненты S_i^h-3 i-го разряда предыдущей суммы. Затем на этот же вход в течение последующих двух циклов поступают компонента a_i^h i-го разряда слагаемого и компонента p_i-1^h-3 переноса с (i-1)-го разряда. Поскольку исходное состояние устройства принимается нулевым, поэтому в i-м цикле работы S_i^h-3 = 0(i = 1-n) и p_i-1^h-3 = =0 (i = 2-n).

После поступления компоненты p_i-1^h-3 в третьем такте этого цикла на h-м выходе второй группы трех информационных выходов 34 i-го систолического полусумматора 14 формируется значение компоненты p_i^h, а на h-м выходе второй группы трех информационных выходов 34 i-го систолического полусумматора 15 - значение компоненты S_i^h. На следующем цикле на h-й вход второй группы трех информационных входов 29 i-х систолических полусумматоров 14 и 15 поступает новый набор:

Gⁱ_h+3 = (p_i-1^h a_i^h+3S_i^h), начиная с компоненты S_i^h.

Компоненты набора G_hⁱ на h-й вход второй группы трех информационных входов 29 i-х систолических полусумматоров 14 и 15 поступают раньше на один цикл относительно поступления одноименных компонент набора G_h+1ⁱ на (h+1)-й вход второй группы трех информационных входов 29 i-х систолических полусумматоров 14 и 15, а также относительно поступления одноименных компонент набора G_hⁱ⁺¹ на h-й вход второй группы трех информационных входов 29 (i+1)-х систолических полусумматоров 14 и 15.

Процесс вычислений в матрице вычислительных ячеек 49 i-го систолического полусумматора 14 начинается с активизации вычислительных ячеек 49 первой строки.

В первом такте i-го цикла работы на вход 54 указанных вычислительных ячеек 49 поступает компонента S_i^h-3 входного набора G_hⁱ, а также происходит циклический сдвиг сверху вниз по столбцам содержимого ячеек 49. Вследствие этого сдвига на входы 53 ячеек 49 первой строки поступают компоненты первого куба покрытия D_n^сл. На выходе 57 указанных ячеек 49 получаются результаты операций пересечения компоненты S_i^h-3 c компонентами первого куба покрытия D_n^сл.

В первом такте i-го цикла работы первый элемент 50 свертки устанавливается в исходное состояние, и во втором такте по группе четырех информационных входов 58 в него поступает результат из ячеек 49 и запоминается.

В последующих двух циклах работы на входы 53 ячеек 49 первой строки поступают компоненты второго и третьего куба покрытия D_n^сл, а на входы 54 - компоненты a_i^h и p_i^h-3. Полученные результаты операций пересечения от ячеек 49 первой строки также запоминаются в первом элементе 50 свертки, а в третьем такте (i+2)-го цикла на выходе 63 этого элемента 50 свертки формируется общий результат операции пересечения входного набора G_hⁱ со всеми кубами покрытия D_n^сл, т.е. вычисляется функция f_n""(G_hⁱ) согласно правилу (8) (h = 1).

С задержкой на один цикл (два цикла) на выходе 63 второго (третьего) элемента 50 свертки вычисляется функция f_n""(G₂ⁱ) (f_n""(G₃ⁱ)). На следующем цикле после вычисления функции f_n""(G₃ⁱ) на выходе 63 первого элемента 50 свертки i-го систолического полусумматора 14 вычисляется функция f_n""(G₄ⁱ) и т.д.

Одновременно с вычислением функций f_n""(G_hⁱ) аналогично происходит вычисление функций f_c""(G_hⁱ) согласно правилу (9) на выходах 63 элемента 50 свертки i-го систолического полусумматора 15.

Таким образом, в устройстве происходит накопление сумм трех последовательностей (10).

Общее время сложения n-разрядного числа к ранее накопленной сумме в устройстве составляет n+2 циклов.

В режиме умножения на входы трех систолических сумматоров поступают три последовательности наборов (10), причем в каждой последовательности n наборов

G_h, G_h+3,..., G_h+3(n-1)-1) связан с одной парой сомножителей.

На h-й вход второй группы трех информационных входов 29 i-х систолических полусумматоров 14 и 15 в i-м цикле работы устройства поступает набор

G_hⁱ = (a_i^hS_i+1^h-3 P_i^h-3), начиная с компоненты Р_i^h-3 переноса с i-го разряда. Затем на этот же вход в течение последующих двух циклов поступают компоненты S_i+1^h+3(i+1)-го разряда предыдущей суммы и компонента a^h_i i-го разряда множимого. Поскольку исходное состояние устройства принимается нулевым, поэтому в i-м цикле работы S_i+1^h-3 = 0 (i = 1 - n - 1) и Р_i^h-3 = 0(i = 1 - n).

После поступления компоненты a_i^h в третьем такте этого цикла на h-м выходе второй группы трех информационных выходов 34 i-го систолического полусумматора 14 формируется значение компоненты P_i^h, а на h-м выходе второй группы трех информационных выходов 34 i-го систолического полусумматора 15 - значение компоненты S_i^h. На следующем цикле на h-й вход второй группы трех информационных входов 29 i-х систолических полусумматоров 14 и 15 поступает новый набор

Gⁱ_h+3 = (a_i^h+3S_i+1^hР_i^h), начина с компоненты Р_i^h.

Процесс вычислений в матрице ячеек 49 i-х систолических полусумматоров 14 и 15 в режиме умножения осуществляется так же, как и в режиме сложения. Общее время умножения двух n-разрядных чисел в устройстве составляет 4 множительное устройство, патент № 2022339

n-1 циклов.

Вычислительная ячейка 49 работает следующим образом.

В первом такте каждого цикла по входу 53 в D-триггер 78 записывается очередная компонента d_h куба d=(d₁d₂d₃) D-покрытия. Одновременно по входу 54 в D-триггере 79 записывается компонента q_i^hнабора G_hⁱ= (g₁^hg₂^hg₃^h). По окончании записи соответствующей информации в D-триггеры 78 и 79 выполняется операция пересечения компонент:

g^h_i множительное устройство, патент № 2022339

d_h;

= 1-4; h = 1-3.

Поскольку значениями компонент g_i^h и d_h могут быть только ноль и единица, поэтому кубическая операция пересечения в ячейке 49 совпадает с логической операцией неравнозначности:

g^h_i множительное устройство, патент № 2022339

d_h= g^h_i множительное устройство, патент № 2022339

d_h которая реализуется с помощью элемента 80 неравнозначности.

Таким образом, на выходе 57 ячейки 49 будет значение логической "1" (логического "0"), если имеется пустое (непустое) пересечение компонент g_i^h и d_h.

В i-х систолических полусумматорах 14 и 15 h-й элемент 50 свертки работает следующим образом.

Перед началом работы устройства на установочный вход 59 приходит сигнал, который устанавливает D-триггер 86 в нулевое состояние.

В первом такте i-го цикла работы по сигналу, поступающему по входу 62, RST-триггеры 81-84 устанавливаются в нулевое состояние.

-й RST-триггер 81-84 в конце первого такта i-го, (i+1)-го и (i+2)-го циклов по группе четырех информационных входов 58 поступает результат операции пересечения компонент g_i^h и d_h от ячейки 49, находящейся в h-й строке и в множительное устройство, патент № 2022339

-м столбце (h = 1-3; множительное устройство, патент № 2022339

= 1-4). Этот результат поступает на S-вход множительное устройство, патент № 2022339

-го RST-триггера 81-84, и если

g^h_i множительное устройство, патент № 2022339

d_h=

то

-й RST-триггер 81-84 устанавливается в единичное состояние. S-вход RST-триггера 81-84 является синхронным, и запись в RST-триггер 82-84 осуществляется во втором такте i-го, (i+1)-го и (i+2)-го циклов по приходе тактового сигнала на вход 60.

Во втором такте (i+2)-го цикла в множительное устройство, патент № 2022339

-м RST-триггере 81-84 формируется результат пересечения всех компонент набора G_hⁱ с компонентами множительное устройство, патент № 2022339

-го куба d кубического покрытия. При пустом (непустом) пересечении набора G_hⁱ с кубом d множительное устройство, патент № 2022339

-й RST-триггер 81-84 находится в единичном (нулевом) состоянии.

Если хотя бы один RST-триггер 81-84 находится в нулевом состоянии, то в третьем такте (i+2)-го цикла по приходе тактового сигнала на вход 61 D-триггера 86 устанавливается в единичное состояние. Если все RST-триггеры 81-84 находятся в единичном состоянии, то в третьем такте (i+2)-го цикла D-триггер 86 устанавливается в нулевое состояние.

Таким образом, в течение трех циклов формируется результат операции пересечения входного набора G_hⁱ с кубами кубического покрытия булевой функции согласно правилу (8) или (9).

В первом такте (i+3)-го цикла по сигналу, поступающему по входу 62, RST-триггеры 81-84 устанавливаются в нулевое состояние и начинается формирование операции пересечения очередного входного набора с кубами кубического покрытия булевой функции. Сигналы на вход 62 приходят через каждые три цикла.

Класс G06F7/52 для умножения; для деления

способ организации умножения чисел с плавающей запятой, представленных в системе остаточных классов - патент 2485574 (20.06.2013)
устройство для умножения чисел в коде "1 из 4" - патент 2475812 (20.02.2013)

устройство и способ комбинаторного кодирования сигналов с низкой сложностью - патент 2438235 (27.12.2011)
ускоренный умножитель на нейронах - патент 2322688 (20.04.2008)
нейронная сеть для деления чисел, представленных в системе остаточных классов - патент 2305312 (27.08.2007)
способ, устройство и команда для выполнения знаковой операции умножения - патент 2275677 (27.04.2006)
целочисленное умножение высокого порядка с округлением и сдвигом в архитектуре с одним потоком команд и множеством потоков данных - патент 2263947 (10.11.2005)
устройство для умножения чисел в коде "1 из 4" - патент 2251144 (27.04.2005)
делитель на нейронах - патент 2249846 (10.04.2005)
умножитель на нейронах - патент 2249845 (10.04.2005)