способ проектирования первичной структуры белка с заданной вторичной структурой

Классы МПК:C12Q1/00 Способы измерения или испытания, использующие ферменты или микроорганизмы; составы для них; способы получения подобных составов
G06F17/00 Устройства или методы цифровых вычислений или обработки данных, специально предназначенные для специфических функций
G06F19/10 биоинформатика, те способы или системы для обработки данных, связанных с генетикой или протеиновыми белками в компьютерной молекулярной биологии
Автор(ы):,
Патентообладатель(и):Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Санкт-Петербургский Государственный электротехнический университет "ЛЭТИ" им. В.И. Ульянова (Ленина) (RU)
Приоритеты:
подача заявки:
2011-09-22
публикация патента:

Изобретение относится к компьютерному способу, использующему биохимические базы данных при разработке новых белковых соединений. Проектирование осуществляется оператором с помощью специально написанной программы PROTCOM на основе использования базы данных пентафрагментов белков. Процесс проектирования состоит в задании и введении в программу PROTCOM начальной последовательности из пяти аминокислот (заданного начального пентафрагмента) и десятизначного числа, записанного в двоичной системе, являющегося описанием вторичной структуры заданного начального пентафрагмента. Проводится поиск этой последовательности в папке базы данных, с номером, соответствующим заданному десятизначному числу. Поиск производят до тех пор, пока заданный начальный пентафрагмент не будет найден в базе данных. После его нахождения считают этот пентафрагмент первым из возможного числа N пентафрагментов проектируемой первичной структуры белка и производят его запись вместе с десятизначным номером папки, описывающим его вторичную структуру, в рабочий файл программы. Далее задают вторичные структуры каждого последующего из (N-1) пентафрагментов путем введения того же или измененного десятизначного числа, описывающего вторичную структуру предыдущего пентафрагмента в программу и проводят поиск в базе данных пентафрагментов, содержащих четыре аминокислоты каждого из (N-1) пентафрагментов, записанных в рабочем файле и одну новую. При нахождении таких пентафрагментов производят выбор одной из новых аминокислот и присоединение ее к четырем последним аминокислотам предыдущего пентафрагмента, запись новой аминокислоты и десятичного номера папки, описывающего вторичную структуру каждого найденного пентафрагмента в рабочий файл. Спроектированной первичной структурой белка считают полученную в рабочем файле последовательность аминокислот, с соответствующим описанием ее вторичной структуры. Предложенный способ проектирования первичной структуры белка существенно упрощает и ускоряет задачу проектирования белков с заданной вторичной структурой. 5 ил., 21 табл., 2 пр.

способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Формула изобретения

Способ проектирования первичной структуры белка с заданной вторичной структурой на основе получения характеризующей ее последовательности аминокислот и описания вторичной структуры, заключающийся в следующем:

A) создают базу данных аминокислотных пентафрагментов белков, содержащую папки с пентафрагментами, причем исходный список папок составлен по их названиям, сформированным на основании закодированного в двоичной системе описания водородных связей пептидных групп пентафрагментов во вторичной структуре белков, и записывают ее на информационный носитель;

Б) создают каталог описаний вторичных структур, содержащий описания вторичных структур в виде последовательности 10-значных булевых чисел;

B) вводят в память компьютера записанную на информационный носитель базу данных аминокислотных пентафрагментов белков;

Г) задают описание вторичной структуры проектируемой первичной структуры белка в виде последовательности 10-значных булевых чисел на основе каталога описаний вторичных структур;

Д) задают и вводят в память компьютера начальную последовательность из пяти аминокислот, принадлежащих к группе из двадцати канонических аминокислот белков, являющуюся заданным начальным пентафрагментом;

Е) задают и вводят в память компьютера описание вторичной структуры заданного начального пентафрагмента в виде десятизначного числа в двоичной системе, являющегося первым 10-значным числом в заданном описании вторичной структуры, которое соответствует названию папки в базе данных, содержащей указанный начальный пентафрагмент;

Ж) вводят в память компьютера программу PROTCOM для выделения и поиска пентафрагментов проектируемого белка в базе данных и записи названий аминокислот найденных пентафрагментов и номеров папок базы данных, описывающих вторичную структуру, в которых обнаружены искомые пентафрагменты;

З) вводят и запоминают заданный начальный пентафрагмент проектируемого белка в виде последовательности из пяти аминокислот в программу PROTCOM;

И) вводят и запоминают заданное описание вторичной структуры заданного начального пентафрагмента в виде десятизначного числа в двоичной системе в программу PROTCOM;

К) проводят поиск заданного начального пентафрагмента проектируемого белка в базе данных с помощью ранее записанной в память компьютера программы PROTCOM, при этом алгоритм поиска включает в себя:

- кодирование заданного начального пентафрагмента для целей поиска в базе данных;

- проведение поиска заданного начального пентафрагмента в базе данных в папке с заданным описанием вторичной структуры пентафрагмента;

- при нахождении в папке заданного начального пентафрагмента считают этот пентафрагмент первым из возможного числа N пентафрагментов проектируемой первичной структуры белка и производят:

- фиксирование номера папки базы данных, содержащей первый пентафрагмент;

- запись последовательности аминокислот первого пентафрагмента в рабочий файл программы;

- запись десятизначного номера папки, описывающего вторичную структуру найденного первого пентафрагмента в рабочий файл;

- при не нахождении в папке заданного начального пентафрагмента:

- задают и вводят в память компьютера новую начальную последовательность из пяти аминокислот, принадлежащих к группе из двадцати канонических аминокислот белков, являющуюся новым заданным начальным пентафрагментом;

- вводят и запоминают новый заданный начальный пентафрагмент проектируемого белка в виде последовательности из пяти аминокислот в программу PROTCOM;

- проводят поиск нового заданного начального пентафрагмента проектируемого белка в базе данных с помощью ранее записанной в память компьютера программы PROTCOM, при этом алгоритм поиска включает в себя:

- кодирование нового заданного начального пентафрагмента для целей поиска в базе данных;

- проведение поиска нового заданного начального пентафрагмента в базе данных в папке с заданной вторичной структурой пентафрагмента;

- повторение задания новых начальных пентафрагментов и поиска новых заданных исходных пентафрагментов осуществляют до тех пор, пока не будет найден пентафрагмент с такой последовательностью аминокислот, которая находится в папке базы данных, описывающей заданную вторичную структуру пентафрагмента;

Л) задают описание вторичной структуры для каждого последующего из (N-1) пентафрагментов, используя описание заданной вторичной структуры в виде последовательности 10-значных булевых чисел, которые соответствуют названиям папок в базе данных, содержащих указанные пентафрагменты, путем введения того же или измененного десятизначного числа, описывающего вторичную структуру предыдущего пентафрагмента, в программу PROTCOM;

М) проводят поиск в базе данных пентафрагментов, содержащих четыре аминокислоты каждого из (N-1) пентафрагментов, записанных в рабочем файле и одну новую, при этом алгоритм поиска включает в себя:

- выделение и запоминание четырех последних аминокислот в каждом из (N-1) пентафрагментов, записанных в рабочем файле;

- поиск пентафрагментов, содержащих четыре последние аминокислоты каждого из (N-1) пентафрагментов, записанных в рабочем файле, и одну новую аминокислоту в базе данных в папке с заданным описанием вторичной структуры;

- при нахождении таких пентафрагментов производят:

- выбор одной из новых аминокислот и присоединение ее к четырем последним аминокислотам предыдущего пентафрагмента;

- запись новой аминокислоты в рабочий файл, отражающий проектируемую первичную структуру белка;

- запись десятичного номера папки, описывающего вторичную структуру каждого найденного пентафрагмента;

- при не нахождении таких пентафрагментов производят:

- задание измененного описания вторичной структуры;

- выделение четырех последних аминокислот в последующем пентафрагменте;

- поиск пентафрагментов, содержащих четыре последних аминокислоты предыдущего пентафрагмента и одну новую аминокислоту в базе данных в папке с измененным описанием вторичной структуры;

- повторение изменения описания вторичной структуры и поиск в базе данных осуществляют до тех пор, пока не будет найден хотя бы один пентафрагмент, содержащий четыре аминокислоты предыдущего пентафрагмента;

Н) спроектированной первичной структурой белка считают полученную в рабочем файле последовательность аминокислот, с соответствующим описанием ее вторичной структуры.

Описание изобретения к патенту

Изобретение относится к компьютерному способу, использующему биохимические базы данных при разработке новых белковых соединений для фармацевтики, биотехнологии и других областей промышленности, а также для научных исследований в медицине, биохимии, молекулярной биологии и генетике, для которых существенно использование новых белковых соединений на основе аминокислот.

Данное изобретение относится к области белковой инженерии - направлению молекулярной биологии, в задачи которой входит создание знаний и методов, позволяющих получать белки с заранее заданной структурой и функцией. Одним из аспектов этого направления является проектирование (дизайн) белковых молекул. Задача проектирования является обратной по отношению к задаче прогнозирования белковой структуры. Если в процессе прогнозирования белковой структуры мы по известной нам последовательности аминокислот должны на первом этапе найти его вторичную структуру, т.е. положение способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спиральных, способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структурных участков и изгибов, то при проектировании мы должны задать такую ранее неизвестную последовательность аминокислот в первичной структуре, спроектированный нами для создания желаемой пространственной структуры, которая в подходящих условия, после ее синтеза примет порядок расположения и размер способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спиральных, способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структурных участков и изгибов.

Проектирование новых белков, как правило, осуществляется на основе разработанной методологии прогнозирования белковых структур и от успешности этой методологии зависит степень удачи при проектировании новых белков с заранее прогнозируемой структурой. В большинстве случаев полученные результаты - это лишь немногочисленные удачные примеры среди большого числа не упоминаемых авторами неудачных вариантов.

Известны попытки проектирования белковых структур, основанные на общих закономерностях их формирования. Одной из первых явилась работа группы Де Градо (D.Eisenberg, W.Wilcox, S.M.Eshita, P.M.Pryciak, S.P.Ho, W.F.Degrado. 1986. The design, synthesis, and crystallization of an alpha-helical peptide. Proteins: Structure, Function, and Bioinformatics. V.1, Issue 1, pp.16-22). Авторы исходили из простой идеи: гидрофобные взаимодействия белковых структур должны быть минимизированы и упрятаны в гидрофобное ядро, а гидрофильные - обеспечивать контакт с растворителем. Исходя из этих соображений авторы спроектировали и синтезировали искусственный белок, содержащий лишь несколько аминокислот (Leu, Glu, Lys) и состоящий из четырех способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спиралей (W.F.DeGrado, L.Regan, S.P.Но. The Design of a Four-helix Bundle Protein. Cold Spring Harb Symp Quant Biol 1987. 52: 521-526).

Однако такой упрощенный подход не позволяет проектировать близкие к реальным сложные белки, состоящие из 20 различных типов аминокислот и обладающие заданными как структурными, так и функциональными свойствами.

В основу искусственного белка альбебетина была положена не существующая в природе структура, которая состояла из двух повторов типа способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 (V.V.Chemeris, D.A.Dolgikh, A.N.Fedorov, A.V.Finkelstein, M.P.Kirpichnikov, V.N.Uversky, O.B.Ptitsyn. A new approach to artificial and modified proteins: theory-based design, synthesis in a cell-free system and fast testing of structural properties by radiolabels. Protein Eng. (1994) 7 (8): 1041-1052). Его структура была разработана на основе физической теории формирования вторичной структуры белков, развиваемой авторами (Ptitsyn O.B., Finkelstein A.V. Theory of protein secondary structure and algorithm of its prediction. Biopolymers. 1983. V.22. P.15-25). Структурное исследование альбебетина показало, что он обладает заданной авторами вторичной структурой и находится в состоянии расплавленной глобулы. Следует отметить, что точность подхода, используемого авторами, не превышает 80%, что не позволяет с полной уверенностью проектировать белки с заданной структурой. Авторы практически спроектировали лишь один белок, и далее исследования были прекращены.

С целью улучшения предсказательных свойств известного метода, использующего физические потенциалы, было предложено ввести ряд параметров, учитывающих свойства последовательностей аминокислот (A.M.Poole и R.Ranganathan. Knowledge-based potentials in protein design. Current Opinion in Structural Biology 2006, 16, 508-513). На основе этого метода, с учетом введенных параметров, авторы спроектировали de novo ряд белков (WO 2007030594, «Methods of using and analyzing biological sequence data», МПК G06F 19/22; G06F 19/18, опубл. 15.03.2007). Однако такой подход носить компилятивный характер и обеспечивает лишь некоторое улучшение взятых за основу методов, не меняя вероятностный характер исходного физического метода.

Известно изобретение, имеющее отношение к аппаратам и методам для количественного проектирования и оптимизации структуры белка (US 2002106694 «Apparatus and method for automated protein design», МПК С07К 1/00; C07K 14/00; C12N 15/10; G06F 17/50; G06F 19/00, опубл. 08.08.2002). Разработанный автоматический метод проектирования, количественно учитывающий взаимодействия поверхностных остатков боковых цепей на основе вычисления трех типов потенциалов и учета стереохимических ограничений, позволяет выбрать из большого числа вариантов белок FSD-1 с мотивом способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 , основанным на структуре домена цинк-фингер-белка. Последовательность аминокислот этого белка имеет очень малое сходство с этим доменом. Несмотря на это, исследование этого белка в растворе методом спектроскопии ядерного магнитного резонанса показали, что он образует структуру, полностью идентичную предложенному для нее дизайну (B.I.Dahiyat and S.L.Mayo. De Novo Protein Design: Fully Automated Sequence Selection. Science, (1997) 278, 82-87).

Недостатком этого метода является необходимость наличия образцового белка, на основе которого осуществляется выбор новой структуры из большого числа вариантов.

С помощью методологии Розетта (Rosetta), представленной в работе (Kuhlman В, Dantas G, Ireton GC, Varani G, Stoddard BL, Baker D. Design of a novel globular protein fold with atomic-level accuracy. Science, 2003, 302(5649), 1364-8), основанной на оптимизации выбранных структур, был спроектирован и синтезирован неизвестный в природе искусственный белок Тор 7, структура которого была подтверждена экспериментально. Ядро Rosetta - физическая модель макромолекулярных взаимодействий и алгоритмов поиска аминокислотной последовательности с наименьшей энергией для заданной белковой структуры. Авторы применили свой метод (US 7574306 «Method and system for optimization of polymer sequences with stable, 3-dimensional conformations», МПК G06F 19/00, опубл. 11.08.2009) к разработке конструкций ряда других белков. Однако этот метод требует довольно сложных расчетов и не всегда приводит к успешным результатам. Для его использования также необходимо наличие образцов.

Такие способы не решают проблемы создания простого способа проектирования новых белков, обладающих любой заданной структурой и функциональными свойствами, а необходимость использования в качестве образцов конкретных белковых структур ограничивает диапазон проектируемых структур.

Решение этой проблемы особенно важно в технологии изготовления фармацевтических и иммунологических препаратов белкового происхождения.

Задачей, на решение которой направлено заявляемое изобретение, является разработка способа проектирования первичной структуры белка, благодаря которому достигается технический результат, заключающийся в упрощении способа с расширением диапазона проектируемых структур.

Предлагаемый способ проектирования первичной структуры белка на основе получения характеризующей ее последовательности аминокислот и описания вторичной структуры, заключается в следующем:

A) создают базу данных аминокислотных пентафрагментов белков, содержащую папки с пентафрагментами, причем исходный список папок составлен по их названиям, сформированным на основании закодированного в двоичной системе описания водородных связей пептидных групп пентафрагментов во вторичной структуре белков, и записывают ее на информационный носитель;

Б) вводят в память компьютера записанную на информационный носитель базу данных аминокислотных пентафрагментов белков;

B) задают и вводят в память компьютера начальную последовательность из пяти аминокислот, принадлежащих к группе из двадцати канонических аминокислот белков, являющуюся заданным начальным пентафрагментом;

Г) задают и вводят в память компьютера описание вторичной структуры заданного начального пентафрагмента в виде десятизначного числа в двоичной системе;

Д) вводят в память компьютера программу PROTCOM для выделения и поиска пентафрагментов проектируемого белка в базе данных и записи названий аминокислот найденных пентафрагментов и номеров папок базы данных, описывающих вторичную структуру, в которых обнаружены искомые пентафрагменты;

Е) вводят и запоминают заданный начальный пентафрагмент проектируемого белка в виде последовательности из пяти аминокислот в программу PROTCOM;

Ж) вводят и запоминают заданную вторичную структуру заданного начального пентафрагмента в виде десятизначного числа в двоичной системе в программу PROTCOM;

З) проводят поиск заданного начального пентафрагмента проектируемого белка в базе данных с помощью ранее записанной в память компьютера программы PROTCOM, при этом алгоритм поиска включает в себя:

- кодирование заданного начального пентафрагмента для целей поиска в базе данных;

- проведение поиска заданного начального пентафрагмента в базе данных в папке с заданной вторичной структурой пентафрагмента;

- при нахождении в папке заданного начального пентафрагмента считают этот пентафрагмент первым из возможного числа N пентафрагментов проектируемой первичной структуры белка и производят:

- фиксирование номера папки базы данных, содержащей первый пентафрагмент;

- запись последовательности аминокислот первого пентафрагмента в рабочий файл программы;

- запись десятизначного номера папки, описывающего вторичную структуру найденного первого пентафрагмента в рабочий файл;

- при не нахождении в папке заданного начального пентафрагмента:

- задают и вводят в память компьютера новую начальную последовательность из пяти аминокислот, принадлежащих к группе из двадцати канонических аминокислот белков, являющуюся новым заданным начальным пентафрагментом;

- вводят и запоминают новый заданный начальный пентафрагмент проектируемого белка в виде последовательности из пяти аминокислот в программу PROTCOM;

- проводят поиск нового заданного начального пентафрагмента проектируемого белка в базе данных с помощью ранее записанной в память компьютера программы PROTCOM, при этом алгоритм поиска включает в себя:

- кодирование нового заданного начального пентафрагмента для целей поиска в базе данных;

- проведение поиска нового заданного начального пентафрагмента в базе данных в папке с заданной вторичной структурой пентафрагмента;

- повторение задания новых начальных пентафрагментов и поиска новых заданных исходных пентафрагментов осуществляют до тех пор, пока не будет найден пентафрагмент с такой последовательностью аминокислот, которая находится в папке базы данных, описывающей заданную вторичную структуру пентафрагмента;

И) задают вторичные структуры каждого последующего из (N-1) пентафрагментов путем введения того же или измененного десятизначного числа, описывающего вторичную структуру предыдущего пентафрагмента в программу PROTCOM;

К) проводят поиск в базе данных пентафрагментов, содержащих четыре аминокислоты каждого из (N-1) пентафрагментов, записанных в рабочем файле и одну новую, при этом алгоритм поиска включает в себя:

- выделение и запоминание четырех последних аминокислот в каждом из (N-1) пентафрагментов, записанных в рабочем файле;

- поиск пентафрагментов, содержащих четыре последние аминокислоты каждого из (N-1) пентафрагментов, записанных в рабочем файле, и одну новую аминокислоту в базе данных в папке с заданной вторичной структурой;

- при нахождении таких пентафрагментов производят:

- выбор одной из новых аминокислот и присоединение ее к четырем последним аминокислотам предыдущего пентафрагмента;

- запись новой аминокислоты в рабочий файл, отражающий проектируемую первичную структуру белка;

- запись десятичного номера папки, описывающего вторичную структуру каждого найденного пентафрагмента;

- при не нахождении таких пентафрагментов производят:

- задание измененной вторичной структуры;

- выделение четырех последних аминокислот в последующем пентафрагменте;

- поиск пентафрагментов, содержащих четыре последних аминокислоты предыдущего пентафрагмента и одну новую аминокислоту в базе данных в папке с измененной вторичной структурой;

- повторение изменения вторичной структуры и поиск в базе данных осуществляют до тех пор, пока не будет найден хотя бы один пентафрагмент, содержащий четыре аминокислоты предыдущего пентафрагмента;

Л) спроектированной первичной структурой белка считают полученную в рабочем файле последовательность аминокислот, с соответствующим описанием ее вторичной структуры.

Способ осуществляют следующим образом:

А) создают базу данных аминокислотных пентафрагментов белков, содержащую папки с пентафрагментами, причем исходный список папок составлен по их названиям, сформированным на основании закодированного в двоичной системе описания водородных связей (Н-связей) пептидных групп пентафрагментов во вторичной структуре белков, и записывают ее на информационный носитель;

а) из Protein Data Bank производят скачивание находящихся в открытом доступе файлов с координатами атомов кристаллов белков, исследованных методом рентгеноструктурного анализа (РСА). Для создания начальной базы было произведено скачивание 2500 файлов белков.

б) с помощью компьютерной программы Protein 3D (Компьютерная программа «Protein 3D», зарегистрировано в Рос. АПО, № 980143 от 03.05.98, авторы: Карасев В.А., Демченко Е.Л.) на основе полученных из Protein Data Bank файлов создают текстовые файлы, содержащие первичные структуры белков с описанием Н-связей, образуемых пептидными группами основных цепей белков во вторичной структуре;

в) с помощью комплекса программ для создания базы проводят следующие действия:

- осуществляют нарезку полученных первичных структур белков на фрагменты из пяти аминокислот (пентафрагменты) таким образом, чтобы каждый последующий фрагмент в процессе движения снизу вверх выделялся со сдвигом на одну аминокислоту по отношению к предыдущему фрагменту, а информация об Н-связях каждого выделяемого фрагмента во вторичной структуре белка полностью сохранялась. В таблице 1 для примера показана процедура нарезки фрагмента текстового файла белка 1SCN (субтилизина Карлсберга). Из таблицы видно, что Н-связи в пентафрагментах остаются неизменными.

- пентафрагменты, гомологичные по структуре Н-связей пептидных групп во вторичной структуре белка, сортируют по папкам, присваивая названиям папок закодированное в двоичной системе описание Н-связей пептидных групп. Наличие Н-связи обозначают цифрой «1», отсутствие водородной связи - цифрой «0».

В каждом пентафрагменте имеется 5 пар пептидных групп, Н-связи связи которых описываются четырьмя видами пар переменных: нет Н-связей - 00, Н-связь Oспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 HN - 01, Н-связь NHспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 О - 10 и две Н-связи: Оспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 HN и NHспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 O - 11. Таким образом название папки, содержащей гомологичные по структуре пентафрагменты, состоит из 10 символов 0 и 1, прочитываемых сверху вниз и записываемых в строку слева направо.

Примеры вариантов выделяемых пентафрагментов и описывающих их десятизначных чисел в двоичной системе приведены в таблице 2. Так, пентафрагмент, полученный из участка способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры (первая строка, пример слева), не содержит Н-связей ближнего порядка и описывается числом 0000000000. Участок с пентафрагментом, который находится в переходной области способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структура - способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спираль (первая строка, пример справа) содержит одно звено со связями Oспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 HN и NHспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 O - пара переменных 11 и четыре звена со связями Oспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 HN - 01 и характеризуется числом 1101010101. Центральная область способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали, как показано в таблице 2, содержит пять звеньев со связями Oспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 HN и NHспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 O - 11 и описывается числом 1111111111. Переходная область способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спираль - способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структура содержит четыре звена со связями NHспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 O - 10 и одно - со связями Oспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 HN и NHспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 O - пара переменных 11, что дает десятизначное число 1010101011. Наконец, участок изгиба способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры с одной Н-связью, как следует из таблицы 2, содержит одно звено со связью NHспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 O - 10, три звена - без Н-связей - 00 и одно звено со связью Oспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 HN - 01, что описывается числом 1000000001.

При создании базы данных в процессе обработки текстовых файлов производилось движение по цепи белка снизу вверх со сдвигом на одну аминокислоту на каждом этапе и при этом каждый выделяемый пентафрагмент получал соответствующее десятизначное описание. В таблице 1 эти значения приведены во втором справа столбце. В результате в этом столбце мы имеем серии перекрывающихся на 4/5 десятизначных описаний структуры участка белка 1CSN, каждое из которых получает в базе данных папку с аналогичным номером. Жирным шрифтом выделены 10-значные номера, для пентафрагментов, аналогичных приведенным в таблице 2.

Таблица 1
Пример процедуры нарезки на пентафрагменты способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирального фрагмента белка 1SCN
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 10-значное описание способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Текстовый файл Этапы выделения пентафрагментов
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
1CSN способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 0000000000 69
69 PRO способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 0000000000 68
68 ILE способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 0000000010 67
67 GLY способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 0000001010 66
66 THR способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 0000101010 65
65 CYS способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 0010101010 64
64 GLY способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1010101011 63
63 ALA N - 59 TYR O способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
63 ALA способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
62 LEU N - 58 THR O способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1010101111 62
62 LEU способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
61 LEU N - 57 ARG O способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1010111111 61
61 LEU способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
60 LYS N - 56 TYR O способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1011111111 60
60 LYS способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
59 TYR O - 63 ALA N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1111111111 59
59 TYR N - 55 GLU O способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
59 TYR способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
58 THR O - 62 LEU N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1111111101 58
58 THR N - 54 ASP O способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
58 THR способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
57 ARG O - 61 LEU N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1111110101 57
57 ARG N - 53 ARG O способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
57 ARG способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
56 TYR O - 60 LYS N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1111010101 56
56 TYR N - 52 LEU O способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
56 TYR способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
55 GLU O - 59 TYR N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1101010101 55
55 GLU N - 51 GLN O способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
55 GLU способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
54 ASP O - 58 THR N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 0101010100 54
54 ASP способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
53 ARG O - 57 ARG N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 53 ARG O - 57 ARG N 010101000053
53 ARGспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 53 ARGспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
52 LEU O - 56 TYR N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 52 LEU O - 56 TYR N 52 LEU O - 56 TYR N0101000000 52
52 LEUспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 52 LEU52 LEU
51 GLN O - 55 GLU N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 51 GLN O - 55 GLU N 51 GLN O - 55 GLU N 51 GLN O - 55 GLU N0100000000 51
51 GLNспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 51 GLN 51 GLN51 GLN
50 PRO 50 PRO 50 PRO50 PRO50 PRO0000000000 50
49 ALA 49 ALA49 ALA 49 ALA49 ALA
48 ASP48 ASP 48 ASP48 ASP
47 SER47 SER 47 SER
46 ARG 46 ARG

способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Центральные участки способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спиралей и способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структур белков описывают, соответственно, ряды повторяющихся 10-значных номеров 1111111111 и 0000000000. В то же время переходные участки от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали и от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуре описываются блоками 10-значных номеров с постепенно изменяющимся составом пар переменных. Примеры таких блоков приведены в таблице 3. Жирным шрифтом выделены начальные и конечные участки переходов и их 10-значные описания.

Таблица 3
Примеры переходных участков и их описаний с помощью 10-значных чисел
Переходные участки от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали10-значное описание Переходные участки от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуре10-значное описание
1SCN способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1SCN способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
59 TYR O - 63 ALA N 68 ILE
59 TYR N - 55 GLU O67 GLY
59 TYR

58 THR O - 62 LEU N
111111111166 THR 0000000000
65 CYS
58 THR N - 54 ASP O 64 GLY
58 THR 111111110163 ALA N - 59 TYR O 0000000010
57 ARG O - 61 LEU N111111010163 ALA0000001010
57 ARG N - 53 ARG O1111010101 62 LEU N - 58 THR O0000101010
57 ARG1101010101 62 LEU
56 TYR O - 60 LYS N0101010100 61 LEU N - 57 ARG O 0010101010
56 TYR N - 52 LEU O 010101000061 LEU
56 TYR0101000000 60 LYS N - 56 TYR O1010101011
55 GLU O - 59 TYR N 010000000060 LYS 1010101111
55 GLU N - 51 GLN O0000000000 59 TYR O - 63 ALA N
55 GLU 59TYRN - 55 GLU O 1010111111
54 ASP O - 58 THR N59 TYR
54 ASP58 THR O - 62 LEU N 1011111111
53 ARG O - 57 ARG N58 THR N - 54 ASP O
53 ARG58 THR 1111111111
52 LEU O - 56 TYR N57 ARG O - 61 LEU N
52 LEU57 ARG N - 53 ARG O
51 GLN O - 55 GLU N 57 ARG
51 GLN 56 TYR O- 60 LYS N
50 PRO 56 TYR N - 52 LEU O
49 ALA56 TYR
48 ASP55 GLU O- 59 TYR N
47 SER55 GLU N - 51 GLN O
46 ARG 55 GLU
1AMF способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 3BBY способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
131 GLU O-135 LYS N 93 PRO
131 GLU N - 127 ILE O92 TYR
131 GLU91 ILE
130 LYS O - 134 GLN N 90 ARG
130 LYS N - 126 GLY O 111111111189 GLU 0000000000
130 LYS1111111101 88 TRP N - 84 ALA O0000000010
129 ALA O -133 LEU N 111111010188 TRP 0000001000
129 ALA N - 125 ALA O111101010187 THR0000100000
129 ALA1101010111 86 PRO0010000000
128 TYRO - 132 ALA N0101011100 85 PRO 1000000011
128 TYR N - 124 PRO O84 ALA O - 88 TRP N
128 TYR0101110000 84 ALA N - 80 GLU O0000001110
127 ILE O - 131 GLU N 84 ALA
127 ILE N - 123 VAL O 011100000083 PHE N - 79 LEU O0000111010
127 ILE1100000001 83 PHE0011101010
126 GLY O - 130 LYS N0000000100 82 ARG N - 78 TYR O1110101011
126 GLY 000001000082 ARG 1010101111
125 ALA O - 129 ALA N81 ASPN - 77 GLU O
125 ALA0001000000 81 ASP1010111111
124 PRO O - 128 TYR N 80 GLU O - 84 ALA N
124 PRO 010000000080 GLU N - 76 ALA O1011111111
123 VAL O - 127 ILE N0000000000 80 GLU 1111111111
123 VAL N - 119 ASP O79 LEU O - 83 PHE N
123 VAL79 LEU N - 75 ILE O
122 HIS79 LEU
121 GLU78 TYR O - 82 ARG N
120 PRO 78 TYR N - 74 ALA O
119 ASP O - 123 VAL N78 TYR
119 ASP77 GLU O - 81 ASP N
118 GLY 77 GLU N - 73 SER O
117 VAL 77 GLU
116 ALA76 ALA O - 80 GLU N
115 LEU76 ALA N - 72 SER O
114 ARG76 ALA

Нами было установлено, что количество таких блоков ограничено и между переходами от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали и от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуре имеется антисимметрия (0способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1). Для этих переходов составлен каталог. Аналогичные антисимметрии (0способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1) наблюдаются также для изгибов способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спиралей и способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структур, примеры которых представлены в таблице 4. Для этих блоков также составлен каталог. Жирным шрифтом выделены начало и конец изгибов и пары переменных, обозначающие водородные связи в изгибах.

Таблица 4
Сопоставление изгиба способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали с разрывом одной Н-связи с изгибом способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры с одной Н-связью
Изгиб способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали с разрывом одной Н-связи 10-значное описаниеИзгиб способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры с одной Н-связью10-значное описание
1DOG способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
334 GLN
333 TYR O - 337 LYS N
333 TYR N - 329 TYR O
333 TYR
332 LEU O - 336 ASP N
332 LEU N - 328 LEU O
332 LEU
331 ALA O - 335 TRP N
331 ALA N - 327 GLN O
331 ALA
330 ASP O - 334 GLN N
330 ASP N - 326 GLU O
330 ASP1GZM
329 TYR O - 333 TYR N 111111111131 LEU 0000000000
329 TYR N - 325 ALA O30 TYR 0000000010
329 TYR 29 TYR
328 LEU O - 332 LEU N 111111110128 GLN 0000001000
328 LEU1111110111 27 PRO0000100000
327 GLN O - 331 ALA N1111011111 26 ALA N - 22 SER O0010000000
327 GLN N - 323 ALA O 110111111126 ALA 1000000001
327 GLN 011111111025 GLU 0000000100
326 GLU O - 330 ASP N1111111011 24PHE0000010000
326 GLU N - 322 LEU O 23 PRO
326 GLU 111110111122 SER O - 26 ALA N 0001000000
325 ALA O - 329 TYR N111011111122 SER0100000000
325 ALA N - 321 THR O 101111110121 ARG
325 ALA1111110101 20 VAL0000000000
324 ALA N - 320 CYS O способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 19 VAL
324 ALA18 GLY способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
323 ALA O - 327 GLN N 17 THR
323 ALA N - 319 LEU O
323 ALA
322 LEU O - 326 GLU N
322 LEU N - 318 PHE O
322 LEU
321 THR O - 325 ALA N
321 THR N - 317 TRP O
321 THR
320 CYS O - 324 ALA N
320 CYS
319 LEU O - 323 ALA N
319 LEU

Путем комбинации эти блоки могут быть использованы для проектирования любых типов вторичных структур белков.

г) производят упрощение выделенных пентафрагментов путем удаления из них информации о структуре Н-связей и оставления только последовательности из пяти аминокислот;

д) с целью облегчения дальнейшей процедуры поиска пентафрагментов в базе данных производят их сортировку на файлы, содержащие фрагменты с одинаковым пятизначным числовым индексом, который им присваивают путем отнесения каждой из аминокислот пентафрагмента к одной из четырех групп преобразований антисимметрии (Карасев В.А., Лучинин В.В. Введение в конструирование бионических наносистем. - М.: Физматлит, 2009, 464 с., глава 8). Эти группы приведены в таблице 5.

Таблица 5
Распределение аминокислот в соответствии с группами антисиммет
Группа антисимметрии способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Аминокислоты
Группа 1Gly, Pro
Группа 2Ala, Leu
Группа 3 Ser, Thr, Cys, Met, His, Trp, Phe, Tyr
Группа 4Asp, Glu, Asn, Gln, Arg, Lys, Val, Ile

При этом в имени файла записывают пятизначный индекс и название папки, в которой этот файл расположен. Если пентафрагмент

Efgспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Def способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Cde способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Bcd способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Abc способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

описывается 10-значным числом 0000000000, его индекс формируют сверху вниз и записывают слева направо: например, если аминокислота Efg относится к группе 1, Def -к группе 2, Cde - к группе 3, Bcd - к группе 4 и Abc - к группе 1, то его 5-значный индекс будет 12341, а имя файла - 12341_0000000000.

Созданная база данных содержит более 500 тысяч пентафрагментов, сортированных на более чем 500 папок. База данных организована в систему, состоящую из 16 гиперкубов, изоморфных булевым гиперкубам В6 (База данных пентафрагментов белков. Авторы: В.А.Карасев, А.И.Беляев, В.В.Лучинин. Зарегистрирована 7 июля 2010 года в Федеральном агентстве РОСПАТЕНТ № 2010620364).

База данных может постоянно пополняться путем обработки новых файлов из Protein Data Bank. Также может быть создана теоретическая база данных.

Б) вводят в память компьютера записанную на информационный носитель базу данных аминокислотных пентафрагментов белков;

В) задают и вводят в память компьютера начальную последовательность из пяти аминокислот, принадлежащих к группе из двадцати канонических аминокислот белков, являющуюся заданным начальным пентафрагментом;

Задуманная начальная последовательность из пяти аминокислот представлена в виде столбца из трехбуквенных сокращенных названий аминокислот с обозначениями слева их номеров, записанная снизу вверх:

5Efg
4Def
3Cde
2Bcd
1Abc

Г) задают и вводят в память компьютера описание вторичной структуры заданного начального пентафрагмента в виде десятизначного числа в двоичной системе;

Д) вводят в память компьютера программу PROTCOM для выделения и поиска пентафрагментов проектируемого белка в базе данных и записи названий аминокислот найденных пентафрагментов и номеров папок базы данных, описывающих вторичную структуру, в которых обнаружены искомые пентафрагменты;

Е) вводят и запоминают заданный начальный пентафрагмент проектируемого белка в виде последовательности из пяти аминокислот в программу PROTCOM;

Оператор вводит в программу задуманную последовательность из пяти аминокислот (заданный начальный пентафрагмент).

Ввод этих аминокислот в программу осуществляется сверху вниз, начиная с пятой аминокислоты, и заканчивается первой аминокислотой: Efg, Def, Cde, Bcd, Abc.

Ж) вводят и запоминают заданную вторичную структуру заданного начального пентафрагмента в виде десятизначного числа в двоичной системе в программу PROTCOM;

Пример вводимого десятизначного числа: 0000000000

З) проводят поиск заданного начального пентафрагмента проектируемого белка в базе данных с помощью ранее записанной в память компьютера программы PROTCOM, при этом алгоритм поиска включает в себя:

- кодирование заданного начального пентафрагмента для целей поиска в базе данных;

Программа считывает аминокислоты пентафрагмента сверху вниз, кодирует их в соответствии с принадлежностью к той или иной группе антисимметрии и записывает кодовый номер слева направо, аналогично сформированным индексам файлов, например: Efg - 1, Def - 2, Cde - 3, Bсd - 4, Abс - 4, кодовый номер - 12344.

- проведение поиска заданного начального пентафрагмента в базе данных в папке с заданной вторичной структурой пентафрагмента;

Для введенного десятизначного числа 0000000000 заданный начальный пентафрагмент ищут в папке базы данных с номером 0000000000, в файле с кодовым номером 12344, т.е. 12344_0000000000.

- при нахождении в папке заданного начального пентафрагмента считают этот пентафрагмент первым из возможного числа N пентафрагментов проектируемой первичной структуры белка и производят:

- фиксирование номера папки базы данных, содержащей первый пентафрагмент;

- запись последовательности аминокислот первого пентафрагмента в рабочий файл программы;

- запись десятизначного номера папки, описывающего вторичную структуру найденного первого пентафрагмента в рабочий файл;

Формат рабочего файла, создаваемого программой PROTCOM, показан в таблице 6.

Таблица 6
Формат рабочего файла, созданного программой PROTCOM
12 3
NSTP bbbbbbbbbb
.способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
5 Efgbbbbbbbbbb
4Defспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
3 Cdeспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
2 Bcdспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
1 Abcспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Запись последовательности аминокислот исследуемого белка в рабочем файле производится снизу вверх, что отражает порядок синтеза белка на рибосоме (удлинение белка происходит путем добавления аминокислот к верхней аминокислоте). Столбцы файла имеют следующее назначение:

1 - номера аминокислот в проектируемом белке, записанные снизу вверх;

2 - последовательность аминокислот в проектируемом белке, записанная снизу вверх с помощью трехбуквенных обозначений;

3 - десятизначные номера папок (bbbbbbbbbb) базы данных, описывающих вторичную структуру проектируемых пентафрагментов, записанные снизу вверх.

в строке N - сигнальное значение конца белковой последовательности (STP).

Жирным шрифтом выделен первый пентафрагмент и десятизначный номер папки, в которой найден данных пентафрагмент.

- при не нахождении в папке заданного начального пентафрагмента:

- задают и вводят в память компьютера новую начальную последовательность из пяти аминокислот, принадлежащих к группе из двадцати канонических аминокислот белков, являющуюся новым заданным начальным пентафрагментом;

- вводят и запоминают новый заданный начальный пентафрагмент проектируемого белка в виде последовательности из пяти аминокислот в программу PROTCOM;

- проводят поиск нового заданного начального пентафрагмента проектируемого белка в базе данных с помощью ранее записанной в память компьютера программы PROTCOM, при этом алгоритм поиска включает в себя:

- осуществляют кодирование нового заданного начального пентафрагмента для целей поиска в базе данных;

- проводят поиск нового заданного начального пентафрагмента в базе данных в папке с заданной вторичной структурой пентафрагмента;

- повторение задания новых начальных пентафрагментов и поиска новых заданных начальных пентафрагментов осуществляют до тех пор, пока не будет найден пентафрагмент с такой последовательностью аминокислот, которая находится в папке базы данных, описывающей заданную вторичную структуру пентафрагмента.

И) задают вторичные структуры каждого последующего из (N-1) пентафрагментов, записанных в рабочем файле путем введения того же или измененного десятизначного числа, описывающего вторичную структуру предыдущего пентафрагмента, в программу PROTCOM;

К) проводят поиск в базе данных пентафрагментов, содержащих четыре аминокислоты каждого из (N-1), записанных в рабочем файле пентафрагментов, и одну новую, при этом алгоритм поиска включает в себя:

- выделение и запоминание четырех последних аминокислот в каждом из (N-1) пентафрагментов, записанных в рабочем файле;

- поиск пентафрагментов, содержащих четыре последние аминокислоты каждого из (N-1) пентафрагментов, записанных в рабочем файле, и одну новую аминокислоту в базе данных в папке с заданной вторичной структурой;

Например, в таблице 7 жирным шрифтом выделены четыре последние аминокислоты предыдущего пентафрагмента и введенное описание вторичной структуры для поиска нового пентафрагмента.

- при нахождении таких пентафрагментов производят:

- выбор одной из новых аминокислот и присоединение ее к четырем последним аминокислотам предыдущего пентафрагмента;

Таблица 7
Выделение аминокислот и описание их вторичной структуры для поиска пентафрагментов в базе данных
123
.способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
6 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 0000000000
5Efg0000000000
4Def способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
3 Cdeспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
2 Bcdспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
1 Abcспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

- производят запись новой аминокислоты в рабочий файл, отражающий проектируемую первичную структуру белка;

- производят запись десятичного номера папки, описывающего вторичную структуру каждого найденного пентафрагмента;

- при не нахождении таких пентафрагментов производят:

- задание измененной вторичной структуры;

- выделение четырех последних аминокислот в последующем пентафрагменте;

- поиск пентафрагментов, содержащих четыре последних аминокислоты предыдущего пентафрагмента и одну новую аминокислоту в базе данных в папке с измененной вторичной структурой;

- повторение изменения вторичной структуры и поиск в базе данных осуществляют до тех пор, пока не будет найден хотя бы один пентафрагмент, содержащий четыре аминокислоты предыдущего пентафрагмента;

Л) считают полученную в рабочем файле последовательность аминокислот с соответствующим описанием ее вторичной структуры спроектированной первичной структурой белка.

В результате действий программы PROMCOM и работы оператора, проектирующего белок, в рабочем файле оказывается полностью заполненным второй столбец, содержащий первичную структуру белка и третий столбец, на основе которого судят о вторичной структуре этого белка. Наличие в 3-м столбце идущих подряд папок 0000000000 характеризует фрагмент как способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структурный. Несколько идущих подряд папок с нумерацией 1111111111 позволяет отнести фрагмент к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спиральному (см. таблицу 2). Переходные участки между способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спиральной и способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структурной конформации, а также изгибы способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры (таблицы 2-4) проектируются и описываются соответствующими папками.

Описание заявки иллюстрируют следующие графические материалы:

Фиг.1. Скринпринты фрагментов вторичной структуры белков 4ННВ и 3EOK, полученные с помощью программы PROTEIN 3D.

а - 4ННВ (человек); б - 3ЕОК (утка);

Фиг.2. Скринпринты фрагментов вторичной структуры белков 1AGD и 2R37, полученных с помощью программы PROTEIN 3D для проектируемого участка белка.

а - пентафрагмент 1AGD (103-107); б - пентафрагмент 2R37 (189-193).

Фиг.3. Скринпринты фрагментов вторичной структуры белков 1AGD и 3В02, полученных с помощью программы PROTEIN 3D для проектируемого участка белка.

а - пентафрагмент 1AGD (105-109); б - пентафрагмент 3В02 (35-39).

Фиг.4. Скринпринты фрагментов вторичной структуры белков 1AGD и 1BAS, полученных с помощью программы PROTEIN 3D для проектируемого участка белка.

а - пентафрагмент 1AGD (106-110); б - пентафрагмент 1BAS (80-84).

Фиг.5. Скринпринты белка 1AGD, полученные с помощью программы PROTEIN 3D для белка 1AGD, исследованного методом PCA.

а - общий вид белка; б - вид фрагмента белка; в - детальный вид вторичной структуры белка 1GDJ, соответствующий заданной вторичной структуре примера 2.

Способ поясняется примерами.

Пример 1.

В данном примере рассмотрен способ проектирования первичной структуры белка, с заданной в виде способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали вторичной структурой, содержащей участок перехода от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали, центральную область способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали и участок перехода от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуре.

При проведении способа проектирования первичной структуры белка с заданной вторичной структурой на основе получения характеризующей ее последовательности аминокислот и описания вторичной структуры, осуществляют следующее:

A) создают базу данных аминокислотных пентафрагментов белков, содержащую папки с пентафрагментами, причем исходный список папок составлен по их названиям, сформированным на основании закодированного в двоичной системе описания водородных связей пептидных групп пентафрагментов во вторичной структуре белков, и записывают ее на информационный носитель;

Б) создают каталог описаний вторичных структур, содержащий описания вторичных структур в виде последовательности десятизначных булевых чисел;

B) вводят в память компьютера записанную на информационный носитель базу данных аминокислотных пентафрагментов белков;

Г) задают описание вторичной структуры проектируемой первичной структуры белка в виде последовательности десятизначных булевых чисел на основе каталога описаний вторичных структур;

В данном примере заданная в виде способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали вторичная структура содержит участки перехода от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали, центральную область способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали и участки перехода от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуре. Их описание оператор находит в каталоге вторичных структур и фиксирует его (табл.8).

Таблица 8
Описание проектируемой вторичной структуры для примера 1
180010101010 Участок перехода от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуре
17 1010101011
16 1010101111
15 1010111111
14 1011111111
13 1111111111Центральная часть способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали
12 1111111111
11 1111111111
10 1111111111
9 1111111101Участок перехода от способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуры к способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спирали
8 1111110101
7 1111010101
6 1101010101
5 0101010100
4 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
3 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
2 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
1 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Д) задают и вводят в память компьютера начальную последовательность из пяти аминокислот, принадлежащих к группе из двадцати канонических аминокислот белков, являющуюся заданным начальным пентафрагментом:

5Asp
4Ala
3Pro
2Ser
1Leu

которая записана в порядке номеров снизу вверх Leu, Ser, Pro, Ala, Asp.

E) задают и вводят в память компьютера описание вторичной структуры заданного начального пентафрагмента в виде десятизначного числа в двоичной системе, являющегося первым десятизначным числом в заданном описании вторичной структуры, которое соответствует названию папки в базе данных, содержащей указанный начальный пентафрагмент: десятизначное число 0101010100. Как видно из таблицы 8, оно является первым десятизначным числом в заданном описании вторичной структуры.

Оно соответствует описанию пентафрагмента, имеющего четыре Н-связи C=Oспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 HN, описываемых парой переменных 01, и одну пару переменных 00 (нет Н-связей) - см. таблицу 3 (переход способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структура - способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спираль).

Ж) вводят в память компьютера программу PROTCOM для выделения и поиска пентафрагментов проектируемого белка в базе данных и записи названий аминокислот найденных пентафрагментов и номеров папок базы данных, описывающих вторичную структуру, в которых обнаружены искомые пентафрагменты;

1. Установка программы проводится в специальную папку, в которую продуцируются рабочие файлы, содержащие проектируемую первичную структуру белка и описывающую ее вторичную структуру в двоичной системе десятизначных чисел.

2. Вновь установленная программа не содержит никаких других файлов кроме самой программы и открывается заставкой для ввода заданного начального пентафрагмента.

3. В начале программы приведена в виде таблицы система двадцати аминокислот, состоящая из четырех групп.

З) вводят и запоминают заданный начальный пентафрагмент проектируемого белка в виде последовательности из пяти аминокислот в программу PROTCOM: оператор осуществляет ввод аминокислот, составляющих заданный начальный пентафрагмент в последовательности с пятой по первую, т.е. сверху вниз: Asp, Ala, Pro, Ser, Leu.

И) вводят и запоминают заданное описание вторичной структуры заданного начального пентафрагмента в виде десятизначного числа в двоичной системе в программу PROTCOM: оператор вводит в программу PROTCOM последовательность 0101010100.

К) проводят поиск заданного начального пентафрагмента проектируемого белка в базе данных с помощью ранее записанной в память компьютера программы PROTCOM, при этом алгоритм поиска включает в себя:

- кодирование заданного начального пентафрагмента для целей поиска в базе данных;

Кодирование осуществляется программой путем отнесения каждой из аминокислот заданного начального пентафрагмента к той или иной группе антисимметрии (табл.5 описания заявки).

В данном примере: Asp - 4, Ala - 2, Pro - 1, Ser - 3, Leu - 2. Эта числовая последовательность записывается в память программы слева направо 42132 и используется для поиска заданного начального пентафрагмента в папке 0101010100 базы данных в файле 42132_0101010100.

- проведение поиска заданного начального пентафрагмента в базе данных в папке с заданным описанием вторичной структуры пентафрагмента;

Программа обнаружила заданный начальный пентафрагмент в файле 42132_0101010100:

Aspспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Ala способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Pro способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Ser способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Leu способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Этот пентафрагмент был выделен из текстового файла, полученного программой PROTEIN 3D на основе обработки координат атомов белка из Protein Data Bank, и имеет структуру 0101010100 переходного участка способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структура - способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -спираль (см. таблицу 8).

Таблицы 9, 10, 11 иллюстрируют работу программы. В левой части, озаглавленной «Ввод», размещаются: в первом столбце вводимые в программу PROTCOM порядковые номера проектируемых аминокислот, во втором столбце помещаются аминокислоты при вводе согласно п.З) или пары переменных согласно п.Л), выбираемые оператором на основе заданной вторичной структуры (таблицы 8). В третьем столбце записывается введенное в программу описание вторичной структуры в виде десятизначного числа. В центральной части, озаглавленной «Поиск пентафрагмента в базе данных», помещаются: в первом столбце наименования файлов с номером кодировки и номером заданной папки, а во втором - наименования найденных в пентафрагментах аминокислот. В правой части таблиц проводится запись, осуществляемая программой PROTCOM в рабочем файле после обнаружения заданного начального пентафрагмента, а в дальнейшем - после выбора аминокислоты в файле с номером кодировки номером заданной папки.

Таблица 9
Поиск заданного начального пентафрагмента в базе данных
Ввод Поиск пентафрагмента в базе данных Запись в рабочем файле
Аминокислоты или пары переменных Введенное описание вторичной структуры Наименование файла с номером кодировки и номером заданной папкиНаименования аминокислот Наименования аминокислот Описание вторичной структуры
5Asp0101010100 42132_0101010100способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 5Asp 0101010100
4Alaспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 4Ala способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
3 Proспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 3Pro способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
2 Serспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 2Ser способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
1 Leuспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1Leu способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

- при нахождении в папке заданного начального пентафрагмента считают этот пентафрагмент первым из возможного числа N пентафрагментов проектируемой первичной структуры белка и производят:

- фиксирование номера папки базы данных, содержащей первый пентафрагмент;

- запись последовательности аминокислот первого пентафрагмента в рабочий файл программы;

- запись десятизначного номера папки, описывающего вторичную структуру найденного первого пентафрагмента в рабочий файл;

Программа обнаружила введенный начальный пентафрагмент в файле с соответствующей кодировкой и номером папки, и делает запись в рабочем файле (табл.9).

Поскольку заданный начальный пентафрагмент был найден, то мы опускаем действия поиска, относящиеся к случаю не нахождения в папке заданного начального пентафрагмента.

Л) задают описание вторичной структуры для каждого последующего из (N-1) пентафрагментов, используя описание заданной вторичной структуры в виде последовательности десятизначных булевых чисел, которые соответствуют названиям папок в базе данных, содержащих указанные пентафрагменты, путем введения того же или измененного десятизначного числа, описывающего вторичную структуру предыдущего пентафрагмента, в программу PROTCOM;

Для этого в процессе задания описания вторичной структуры программа PROTCOM предлагает ввести пары переменных 00, 01, 10 или 11. Из таблицы 8 видно, что следующим десятизначным числом является 1101010101. По этой причине оператор выбирает 11, и вводит пару переменных 11 в программу (столбец «Аминокислоты и пары переменных» в таблице 10). Программа добавляет 11 слева и удаляет пару цифр справа, что приводит к изменению десятизначного числа, описывающего вторичную структуру предыдущего пентафрагмента, что отражено в столбце «Описание заданной вторичной структуры» таблицы 10.

Таблица 10
Поиск второго пентафрагмента в базе данных
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 Ввод Поиск пентафрагмента в базе данных Запись в рабочем файле
Аминокислоты или пары переменных Введенное описание вторичной структуры Наименование файла с номером кодировки и номером заданной папкиНаименования аминокислот Наименования аминокислот Описание вторичной структуры
611 110101010134213_1101010101 Ser6 Lys1101010101
44213_1101010101Lys
5Asp 010101010042132_0101010100 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 5Asp 0101010100
4Alaспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 4Ala способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
3 Proспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 3Pro способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
2 Serспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 2Ser способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
1 Leuспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1Leu способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

M) проводят поиск в базе данных пентафрагментов, содержащих четыре аминокислоты каждого из (N-1) пентафрагментов, записанных в рабочем файле, и одну новую, при этом алгоритм поиска включает в себя:

- выделение и запоминание четырех последних аминокислот в каждом из (N-1) пентафрагментов, записанных в рабочем файле;

- поиск пентафрагментов, содержащих четыре последние аминокислоты каждого из (N-1) пентафрагментов, записанных в рабочем файле, и одну новую аминокислоту в базе данных в папке с заданным описанием вторичной структуры;

Для этого программа выделяет в пентафрагменте, записанном рабочем файле таблицы 10, четыре аминокислоты, записанных сверху вниз: Asp, Ala, Pro, Ser.

Далее программа их кодирует в соответствии с принадлежностью к той или иной группе антисимметрии и записывает кодовый номер слева направо, аналогично сформированным индексам файлов, но без первой аминокислоты: 4213 и проводит в базе данных поиск пентафрагментов, содержащих четыре выделенных аминокислоты, в папке с заданной структурой следующего пентафрагмента (1101010101), т.е в файлах Х4213_1101010101, где X может принимать значения 1, 2, 3, 4, соответствующие номерам групп антисимметрии (см. таблицу 5 описания заявки) - 14213_1101010101, 24213_1101010101, 34213_1101010101, 44213_1101010101.

В результате поиска были найдены пентафрагменты, содержащие четыре последних аминокислоты: Asp, Ala, Pro, Ser и следующие пятые аминокислоты, записанные вместе с кодами белков, из которых они были получены:

- в файле группы 1 (14213_1101010101): пентафрагменты не найдены;

- в файле группы 2 (24213_1101010101) - пентафрагменты не найдены;

- в файле группы 3 (34213_1101010101): 1 - Ser;

- в файле группы 4 (44213_1101010101): 2 - Lys;

- при нахождении таких пентафрагментов оператор производит:

- выбор одной из новых аминокислот и присоединение ее к четырем последним аминокислотам предыдущего пентафрагмента;

Из найденных программой аминокислот можно выбрать либо Ser в файле группы 3, либо Lys в файле группы 4. При этом программа допускает выбор только одного варианта. В зависимости от выбора результат проектирования будет различным, что может быть выяснено только в результате проектирования. В качестве пятой аминокислоты оператор выбрал Lys и ввел эту информацию в программу.

Далее программа производит:

- запись новой аминокислоты в рабочий файл («Запись в рабочем файле», табл.10), отражающий проектируемую первичную структуру белка (Lys);

- запись десятичного номера папки, описывающего вторичную структуру каждого найденного пентафрагмента (1101010101);

Поскольку пентафрагмент был найден, то мы опускаем этапы поиска, относящиеся к случаю не нахождения в папке пентафрагмента.

Далее производят повторение действий согласно пп. Л) и М) до окончания процесса проектирования. Как видно из таблицы 11, в процессе проектирования последовательности аминокислот на этапах 11, 13 и 18 появлялась возможность выбора из двух или трех аминокислот, на остальных этапах программа обнаруживала лишь одну аминокислоту.

Н) спроектированной первичной структурой белка считают полученную в рабочем файле последовательность аминокислот, с соответствующим описанием ее вторичной структуры, записанная в рабочем файле программы PROTCOM и представленная в правой части таблицы 11.

Таблица 11
Поиск последующих пентафрагментов в базе данных
Ввод Поиск пентафрагмента в базе данных Запись в рабочем файле
Аминокислоты или пары переменных Введенное описание вторичной структуры Наименование файла с номером кодировки и номером заданной папкиНаименова-ния аминокислот Наименования аминокислот Описание вторичной структуры
18000010101010 11443_0010101010Gly способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 0010101010
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 41443_0010101010 Lys18Gly способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
17 10101010101114433_1010101011 Gly17 Gly1010101011
16101010101111 44334_1010101111Ile 16Ile 1010101111
15 10101011111143341_1010111111 Lys15 Lys1010111111
14101011111111 33414_1011111111Ser 14Ser 1011111111
13 11111111111124144_1111111111 Alaспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 34144_1111111111 Phe13Phe 1111111111
12111111111111 41444_1111111111Val 12Val 1111111111
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 Ileспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
11 11111111111114443_1111111111 Gly11 Gly1111111111
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 24443_1111111111 Alaспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 34443_1111111111 Thrспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
10 11111111111144434_1111111111 Lys10 Lys1111111111
9111111111101 44344_1111111101Val 9Val 1111111101
8 11111111010143442_1111110101 Asn8 Asn1111110101
7111111010101 34421_1111010101Thr 7Thr 1111010101
6 11110101010134213_1101010101 Serспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 44213_1101010101 Lys6Lys 1101010101
5 Asp0101010100 42132_0101010100способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 5Asp 0101010100
4Alaспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 4Ala способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
3 Proспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 3Pro способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
2 Serспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 2Ser способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
1 Leuспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1Leu способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Для экспериментального подтверждения в существовании спроектированной в примере 1 первичной структуры белка с заданной вторичной структурой в Protein Data Bank было найдено несколько фрагментов белков, имеющих последовательность аминокислот, частично совпадающую с последовательностью аминокислот, представленную в примере 1 (табл.12).

Как видно из таблицы 12, спроектированная первичная структура белка в примере 1 имеет наибольшее сходство с первичной структурой фрагментов белков 4ННВ и 3ЕОК. Так, спроектированная первичная структура белка с 1-го по 10-ю аминокислоту полностью идентична с первичной структурой фрагмента белка 4ННВ со 2-й по 11-ю аминокислоту. В то же время, с 11-й по 18-ю аминокислоты спроектированная первичная структура белка идентична с первичной структурой фрагмента белка 3ЕОК с 12-й по 19-ю аминокислоты.

Таблица 12
Сопоставление первичных структур белковых фрагментов
Спроектированная последовательность аминокислот примера 1 № аминокислот в белках Фрагменты белков
4ННВ 3ЕОК3DHR3D4X
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
18 Gly19Ala GlyGly Ser
17 Gly18Gly GlyGly Gly
16 Ile17Val IleIle Ile
15 Lys16Lys LysLys Lys
14 Ser15Gly SerAla Gly
13 Phe14Trp PhePhe Trp
12 Val13Ala ValVal Cys
11 Gly12Ala GlyAla Ala
10 Lys11Lys LysLys Lys
9 Val10Val ValVal Val
8 Asn9Asn AsnAsnAsn
7Thr 8Thr ThrSerSer
6Lys 7Lys LysLysLys
5Asp 6Asp AspAspAsp
4Ala 5Ala AlaAsnAla
3Pro 4Pro AlaAlaAla
2Ser 3Ser SerSerSer
1Leu 2Leu LeuLeuLeu

В таблице 13 приведено двумерное описание водородных связей представленных в таблице 12 фрагментов белков, полученное с помощью программы Protein 3D на основе файлов таблицы 12. Там же дано описание их вторичной структуры в виде десятизначных булевых чисел, которое полностью идентично заданному описанию вторичной структуры спроектированной первичной структуры (таблица 11).

На фиг.1,а и 1,б представлены скринпринты фрагментов вторичной структуры белков 4ННВ и 3EOK, полученные с помощью программы Protein 3D, и соответствующие им последовательности аминокислот первичной структуры. На этих фигурах видно, что вторичная структура фрагментов, из которых состоит спроектированная первичная структура примера 1, имеет перекрывание с 7-й по 11-ю аминокислоты, так же как и перекрывание последовательностей аминокислот их первичной структуры (на последовательностях оно выделено курсивом). Следовательно, спроектированная последовательность имеет идентичную с исходными фрагментами вторичную структуру.

Таким образом, в примере 1 представлена спроектированная первичная структура белка, состоящая из фрагментов белков 4ННВ и 3ЕОК, заданная вторичная структура которой полностью совпадает с вторичной структурой каждого из этих белков.

Таблица 13
Фрагменты белков с двумерным описанием их водородных связей
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 Описание вторичной структуры белковых фрагментов
Вторичная структура фрагментов белков из Protein Data Bank
4ННВ3EOK 3DHR3D4X
19 ALA19 GLY 19 GLY19 SER способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
18 GLY N - 14 TRP O 18 GLY N - 14 PHE О 18 GLY N - 14 PHE О18 GLY N - 14TRP Oспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
18 GLY 18 GLY18 GLY 18 GLYспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
17 VAL N - 13 ALA О 17 ILE N - 13 VAL О 17 ILE N - 13 VAL О17 ILE N - 13 CYS Oспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
17 VAL 17 ILE17 ILE 17 ILEспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
16 LYS N - 12 ALA О 16 LYS N - 12 GLY О 16 LYS N - 12 ALA О16 LYS N - 12 ALA О180010101010
16 LYS16 LYS16 LYS16 LYSспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
15 GLY N - 11 LYS О 15 SER N - 11 LYS О 15 ALA N - 11 LYS О15 GLY N - 11 LYS О171010101011
15 GLY15 SER15 ALA15 GLYспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
14 TRPO - 18 GLY N 14 PHE О - 18 GLY N 14 PHE О - 18 GLY N14 TRP O - 18 GLY N161010101111
14 TRPN - 10 VAL О 14 PHE N - 10 VAL О14 PHE N - 10 VAL О14 TRP N - 10 VAL О способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
14 TRP 14 PHE14 PHE 14 TRP151010111111
13 ALA О - 17 VAL N 13 VAL О - 17 ILE N13 VAL О - 17 ILE N13 CYS O - 17 ILE N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1011111111
13 ALAN - 9 ASN О13 VAL N - 9 ASN О 13 VAL N - 9 ASN О 13 CYS N - 9 ASN О14 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
13 ALA 13 VAL13 VAL 13 CYS131111111111
12 ALA О - 16 LYS N 12 GLY О - 16 LYS N12 ALA О - 16 LYS N12 ALA О - 16 LYS N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1111111111
12 ALAN - 8 THR О12 GLY N - 8 THR О 12 ALAN - 8 SER О 12 ALAN - 8 SER О12 1111111111
12 ALA 12 GLY12 ALA 12 ALAспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
11 LYS О - 15 GLY N 11 LYS О - 15 SER N 11 LYS О - 15 ALAN11 LYS О - 15 GLY N111111111111
11 LYS N - 7 LYS О 11 LYS N - 7 LYS О11 LYS N - 7 LYS О 11 LYS N - 7 LYS О 101111111111
11 LYS11 LYS 11 LYS11 LYSспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
10 VAL О - 14 TRP N 10 VAL О - 14 PHE N 10 VAL О - 14 PHE N10 VAL О - 14TRP N91111111101
10 VAL N - 6 ASP О 10 VAL N - 6 ASP О10 VAL N - 6 ASP О 10 VAL N - 6 ASP Оспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
10 VAL 10 VAL10 VAL 10 VAL81111110101
9 ASN О - 13 ALAN 9 ASN О - 13 VAL N9 ASN О - 13 VAL N 9 ASN О - 13CYS N 71111010101
9 ASN N - 5 ALA О9 ASN N - 5 ALA О 9 ASN N - 5 ASN О 9 ASN N - 5 ALA Оспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
9 ASN 9 ASN9 ASN9 ASN61101010101
8 THR О - 12 ALA N 8 THR О - 12 GLY N8 SER О - 12 ALA N 8 SER О - 12 ALA Nспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
8 THR N - 4 PRO О 8 THR N - 4 ALA О 8 SER N - 4 ALA О8 SER N - 4 ALA О 50101010100
8 THR8 THR 8 SER8 SER способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
7 LYS О - 11 LYS N 7 LYS О - 11 LYS N 7 LYS О - 11 LYS N7 LYS О - 11 LYS N 4способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
7 LYS N - 3 SER О 7 LYS N - 3 SER О 7 LYS N - 3 SER О7 LYS N - 3 SER О 3способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
7 LYS 7 LYS7 LYS7 LYSспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
6 ASP O - 10 VAL N 6 ASP О - 10 VAL N 6 ASP О - 10 VAL N6 ASP О - 10 VAL N 2способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
6 ASP 6 ASP6 ASP6 ASP1способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
5 ALA О - 9 ASN N 5 ALA О - 9 ASN N 5 ASN О - 9 ASN N5 ALA О - 9 ASN N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
5 ALA 5 ALA5 ASN5 ALAспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
4 PRO О - 8 THR N 4 ALA О - 8 THR N 4 ALA О - 8 SER N4 ALA О - 8 SER N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
4 PRO 4 ALA4 ALA4 ALAспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
3 SER О - 7 LYS N 3 SER О - 7 LYS N 3 SER О - 7 LYS N3 SER О - 7 LYS N способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
3 SER 3 SER3 SER3 SERспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
2 LEU 2 LEU2 LEU2 LEUспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Сведения о вторичной структуре белков 4ННВ и 3EOK, относящихся к классу гемоглобинов, опубликованы и представлены таблице 14.

Таблица 14
Список белков, в которых методом PCА была исследована структура, совпадающая с заданной нами вторичной структурой
Код белка Название белка и источник выделенияЛитература
14ННВ HEMOGLOBIN SUBUNIT ALPHA HUMAN (человек) G. Fermi, M.F. Perutz B. Shaanan, R. Fourme The crystal structure of human deoxyhaemoglobin at 1.74 angstroms resolution. J. Mol. Biol. v.175, p.159 (1984)
23EOKHEMOGLOBIN SUBUNIT ALPHA DUCK (утка)Sathya Moorthy, K. Neelagandan, M. Balasubramanian, M.N. Ponnuswamy. Crystal Structure Determination of Duck (Anas Platyrhynchos) Hemoglobin at 2.1 Angstrom Resolution To be published (структурные данные из PDB-банка)

Пример 2.

В данном примере рассмотрен способ проектирования первичной структуры белка, с заданной в виде инвертированного способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -изгиба вторичной структурой.

При проведении способа проектирования первичной структуры белка с заданной вторичной структурой на основе получения характеризующей ее последовательности аминокислот и описания вторичной структуры, осуществляют следующее:

A) создают базу данных аминокислотных пентафрагментов белков, содержащую папки с пентафрагментами, причем исходный список папок составлен по их названиям, сформированным на основании закодированного в двоичной системе описания водородных связей пептидных групп пентафрагментов во вторичной структуре белков, и записывают ее на информационный носитель;

Б) создают каталог описаний вторичных структур, содержащий описания вторичных структур в виде последовательности десятизначных булевых чисел;

B) вводят в память компьютера записанную на информационный носитель базу данных аминокислотных пентафрагментов белков;

Г) задают описание вторичной структуры проектируемой первичной структуры белка в виде последовательности десятизначных булевых чисел на основе каталога описаний вторичных структур;

В данном примере вторичная структура задана в виде инвертированного способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -изгиба. Ее описание оператор находит в каталоге вторичных структур и фиксирует ее (табл.15).

Таблица 15
Описание проектируемой вторичной структуры для примера 2
140000000001
130000000100
120000010000
110001000000
100100000010
90000001000
80000100000
70010000000
61000000000
50000000000
4способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
3 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
2 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
1 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Д) задают и вводят в память компьютера начальную последовательность из пяти аминокислот, принадлежащих к группе из двадцати канонических аминокислот белков, являющуюся заданным начальным пентафрагментом:

5Val
4Asp
3Cys
2Gly
1Tyr

которая записана в порядке номеров снизу вверх: Tyr, Gly, Cys, Asp, Val.

E) задают и вводят в память компьютера описание вторичной структуры заданного начального пентафрагмента в виде десятизначного числа в двоичной системе, являющегося первым десятизначным числом в заданном описании вторичной структуры, которое соответствует названию папки в базе данных, содержащей указанный начальный пентафрагмент: 10-значное число 0000000000. Как видно из таблицы 15, оно является первым десятизначным числом в заданном описании вторичной структуры.

Ж) вводят в память компьютера программу PROTCOM для выделения и поиска пентафрагментов проектируемого белка в базе данных и записи названий аминокислот найденных пентафрагментов и номеров папок базы данных, описывающих вторичную структуру, в которых обнаружены искомые пентафрагменты;

Установка программы проводится аналогично п.Ж в примере 1.

З) вводят и запоминают заданный начальный пентафрагмент проектируемого белка в виде последовательности из пяти аминокислот в программу PROTCOM: оператор осуществляет ввод аминокислот, составляющих заданный начальный пентафрагмент в последовательности с пятой по первую, т.е. сверху вниз: Val, Asp, Cys, Gly, Tyr.

И) вводят и запоминают заданное описание вторичной структуры заданного начального пентафрагмента в виде десятизначного числа в двоичной системе в программу PROTCOM: оператор вводит в программу PROTCOM последовательность 0000000000.

К) проводят поиск заданного начального пентафрагмента проектируемого белка в базе данных с помощью ранее записанной в память компьютера программы PROTCOM, при этом алгоритм поиска включает в себя:

- кодирование заданного начального пентафрагмента для целей поиска в базе данных;

Кодирование осуществляется программой путем отнесения каждой из аминокислот заданного начального пентафрагмента к той или иной группе антисимметрии (табл.5 описания заявки).

В данном примере: Val - 4, Asp - 4, Cys - 3, Gly - 1, Tyr - 3. Эта числовая последовательность записывается в память программы слева направо 44313 и используется для поиска заданного начального пентафрагмента в папке 0000000000 базы данных в файле 44313_0000000000.

- проведение поиска заданного начального пентафрагмента в базе данных в папке с заданным описанием вторичной структуры пентафрагмента;

Программа обнаружила заданный начальный пентафрагмент в файле 44313_0000000000:

Valспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Asp способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Cys способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Gly способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
Tyr способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Этот пентафрагмент был выделен из текстового файла, полученного программой PROTEIN 3D на основе обработки координат атомов белка из Protein Data Bank и имеет способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 -структуру, описываемую как 0000000000, не содержащую Н-связей в ближайшем окружении пентафрагмента.

Таблицы 16, 17, 18 иллюстрируют работу программы. В левой части, озаглавленной «Вввод» размещаются: в первом столбце вводимые в программу PROTCOM порядковые номера проектируемых аминокислот, во втором столбце помещаются аминокислоты при вводе согласно п.З) или пары переменных согласно п.Л), выбираемые оператором на основе заданной вторичной структуры (таблицы 15). В третьем столбце записывается введенное в программу описание вторичной структуры в виде десятизначного числа. В центральной части, озаглавленной «Поиск пентафрагмента в базе данных», помещаются: в первом столбце наименования файлов с номером кодировки и номером заданной папки, а во втором - наименования найденных в пентафрагментах аминокислот. В правой части таблиц проводится запись, осуществляемая программой PROTCOM в рабочем файле после обнаружения заданного начального пентафрагмента, а в дальнейшем - после выбора аминокислоты в файле с номером кодировки номером заданной папки.

- при нахождении в папке заданного начального пентафрагмента считают этот пентафрагмент первым из возможного числа N пентафрагментов проектируемой первичной структуры белка и производят:

- фиксирование номера папки базы данных, содержащей первый пентафрагмент;

- запись последовательности аминокислот первого пентафрагмента в рабочий файл программы;

- запись десятизначного номера папки, описывающего вторичную структуру найденного первого пентафрагмента в рабочий файл;

способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Программа обнаружила введенный начальный пентафрагмент в файле с соответствующей кодировкой и номером папки, и делает запись в рабочем файле (табл.16). Поскольку заданный начальный пентафрагмент был найден, то мы опускаем действия поиска, относящееся к случаю не нахождения в папке заданного начального пентафрагмента.

Л) задают описание вторичной структуры для каждого последующего из (N-1) пентафрагментов, используя описание заданной вторичной структуры в виде последовательности десятизначных булевых чисел, которые соответствуют названиям папок в базе данных, содержащих указанные пентафрагменты, путем введения того же или измененного десятизначного числа, описывающего вторичную структуру предыдущего пентафрагмента, в программу PROTCOM;

Для этого в процессе задания описания вторичной структуры программа PROTCOM предлагает ввести пары переменных 00, 01, 10 или 11. Из таблицы 15 видно, что следующим десятизначным числом является 1000000000. По этой причине оператор выбирает 10, и вводит пару переменных 10 в программу (столбец «Аминокислоты или пары переменных» в таблице 17). Программа добавляет 10 слева и удаляет пару цифр справа, что приводит к изменению десятизначного числа, описывающего вторичную структуру предыдущего пентафрагмента, что отражено в столбце «Описание заданной вторичной структуры» таблицы 17.

М) проводят поиск в базе данных пентафрагментов, содержащих четыре аминокислоты каждого из (N-1) пентафрагментов, записанных в рабочем файле, и одну новую, при этом алгоритм поиска включает в себя:

- выделение и запоминание четырех последних аминокислот в каждом из (N-1) пентафрагментов, записанных в рабочем файле;

- поиск пентафрагментов, содержащих четыре последние аминокислоты каждого из (N-1) пентафрагментов, записанных в рабочем файле, и одну новую аминокислоту в базе данных в папке с заданным описанием вторичной структуры;

способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Для этого программа выделяет в пентафрагменте, записанном рабочем файле таблицы 16 четыре аминокислоты, записанных сверху вниз: Val, Asp, Cys, Gly.

Далее программа их кодирует в соответствии с принадлежностью к той или иной группе антисимметрии и записывает кодовый номер слева направо, аналогично сформированным индексам файлов, но без первой аминокислоты: 4431 и проводит в базе данных поиск пентафрагментов, содержащих четыре выделенных аминокислоты, в папке с заданной структурой следующего пентафрагмента (1000000000), т.е в файлах Х4431_1000000000, где X может принимать значения 1, 2, 3, 4, соответствующие номерам групп антисимметрии (см. таблицу 5 описания заявки) - 14431_1000000000, 24431_1000000000, 34431_1000000000, 44431_1000000000.

В результате поиска были найдены пентафрагменты, содержащие четыре последних аминокислоты: Val, Asp, Cys, Gly и следующие пятые аминокислоты, записанные вместе с кодами белков, из которых они были получены:

- в файле группы 1 (14431_1000000000): Gly;

- в файле группы 2 (24431_1000000000) - пентафрагменты не найдены;

- в файле группы 3 (34431_1000000000): - пентафрагменты не найдены;

- в файле группы 4 (44431_1000000000): - пентафрагменты не найдены.

Обращаем внимание, что в файлах групп 2, 3, 4 пентафрагменты не найдены. Для проектирования используем единственную аминокислоту Gly.

- при нахождении таких пентафрагментов оператор производит:

- выбор одной из новых аминокислот и присоединение ее к четырем последним аминокислотам предыдущего пентафрагмента;

В качестве пятой аминокислоты оператор выбрал Gly и ввел эту информацию в программу.

Далее программа производит:

- запись новой аминокислоты в рабочий файл («Запись в рабочем файле», табл.17), отражающий проектируемую первичную структуру белка (Gly);

- запись десятичного номера папки, описывающего вторичную структуру каждого найденного пентафрагмента (1000000000);

Поскольку пентафрагмент был найден, то мы опускаем действия поиска, относящееся к случаю не нахождения в папке пентафрагмента.

Далее производят повторение действий согласно пп.Л) и М) до окончания процесса проектирования. Как видно из таблицы 18, в процессе проектирования последовательности аминокислот на всех этапах появлялась возможность выбора лишь из одной аминокислоты.

способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

H) спроектированной первичной структурой белка считают полученную в рабочем файле последовательность аминокислот, с соответствующим описанием ее вторичной структуры, записанной в рабочем файле программы PROTCOM и представленная в правой части таблицы 18.

Для экспериментального подтверждения существования спроектированной в примере 2 первичной структуры белка с заданной вторичной структурой в Protein Data Bank было найдено несколько фрагментов белков, имеющих последовательность аминокислот, полностью совпадающую либо со всей спроектированной последовательностью аминокислот примера 2, либо с участком этой последовательности (табл.19).

способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

Как следует из таблицы 19, спроектированная нами первичная структура аминокислот для примера 2 оказалась идентична последовательности аминокислот фрагмента белка 1AGD. В таблице 20 приведено двумерное описание водородных связей представленных в таблице 19 фрагментов белков, полученное с помощью программы Protein 3D на основе файлов таблицы 19. Описание их вторичной структуры в виде десятизначных булевых чисел приведено в правом столбце таблицы 20. Для белка 1AGD полностью идентично заданному описанию вторичной структуры спроектированной первичной структуры белка примера 2 (табл.18). Кроме того, найдено, отдельные участки этой последовательности могут быть составлены на основе пентафрагментов белков 2R37 ( № 9), 3В02 ( № 11) и 1BAS ( № 12), которые не имеют никакого родства с белком 1AGD. В таблице 20 приведено описание их вторичной структуры в виде десятизначных булевых чисел, которое полностью совпадает с заданным описанием вторичной структуры спроектированной первичной структуры примера 2.

Таблица 20
Вторичная структура фрагментов белков
Фрагменты вторичной структуры белков из Protein Data Bank Описание вторичной структуры фрагмента белка 1AGD
1AGD2R373B02 1BAS
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 140000000001
112 GLYспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 130000000100
111 ARG способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 84 LEU 120000010000
110 LEU83 LEU
109 LEUспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 39 LEU 82 ARG О - 78 LYS N11 0001000000
108 ARG О - 104 GLY Nспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 38 ARG О - 34 LEU N81 GLY 100100000010
108 ARG
107 GLYспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 37 GLY 80 ASP90000001000
106 ASP 192 GLY 191 ASP36 ASP 35 PRO способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 80000100000
105 PRO 190 PROспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 7 0010000000
104 GLY N - 108 ARG О
104 GLY 189 GLY N - 193 ILE Оспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 61000000000
103 VAL 188 VALспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 50000000000
102 ASP способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 4 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
101 CYS
100 GLYспособ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 3способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
99 TYR способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 2способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002
способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002 1способ проектирования первичной структуры белка с заданной вторичной   структурой, патент № 2511002

На фиг.2-4 представлены скринпринты фрагментов вторичной структуры белков 1AGD, 2R37, 3В02, 1BAS, полученные с помощью программы Protein 3D. Сопоставление фрагмента белка 1AGD с фрагментом белка 2R37 (фиг.2,а и 2,б), с фрагментом белка 3В02 (фиг.3,а и 3,б) и фрагментом белка 1BAS (фиг.4,а и 4,б) позволяет сделать вывод, их вторичные структуры идентичны и при этом они взаимозаменяемы. Это означает, что нет разницы в том, спроектирован белок примера 2 на основе пентафрагментов только белка 1AGD или с использованием пентафрагментов, полученных из четырех разных белков - 1AGD, 2R37, 3В02 и 1BAS.

Общий вид исследованного методом PCА белка 1AGD показан на фиг.5,а. В прямоугольнике выделен фрагмент, соответствующий первичной структуре, спроектированный заявляемым способом. На фиг.5,б он показан крупным планом, а на фиг.5,в - детальный вид фрагмента вторичной структуры белка 1GDJ, соответствующий заданной вторичной структуре примера 2. Приведенные фигуры наглядно иллюстрируют присутствие данного фрагмента в реальном белке.

Таким образом, в примере 2 спроектированная первичная структура белка подтверждается двумя вариантами. Первый вариант: первичная структура состоит только из пентафрагментов белка 1AGD. Заданная вторичная структура спроектированного белка примера 2 полностью совпадает с вторичной структурой фрагмента белка 1AGD. Второй вариант: первичная структура состоит из пентафрагментов, полученных из четырех разных белков - 1AGD, 2R37, 3В02 и 1BAS. Описание вторичных структур пентафрагментов белков 1AGD, 2R37, 3В02 и 1BAS также полностью совпадает с заданным описанием вторичной структуры спроектированной первичной структуры белка примера 2.

Сведения о вторичной структуре белков 1AGD, 2R37, 3В02 и 1BAS опубликованы и представлены таблице 21.

Таблица 21
Список белков, в которых методом РСА была исследована структура, совпадающая с заданной вторичной структурой
№ этапаКод белка Название белкаЛитература
5-8, 10, 13, 141AGD Histocompatipility complex S.W. Reid, S. McAdam, K.J. Smith, P. Klenerman, C.A. O'callaghan, K. Harlos, B.K. Jakobsen, A.J. McMichael, J.I. Bell, D.I. Stuart, E.Y Jones Antagonist Hiv-1 Gag Peptides Induce Structural Changes In Hla В8 J. Exp. Med. V. 184 2279 1996 ASTM JEMEAV US ISSN 0022-1007 0774 Resolution 2.05 Angstroms
92R37Human glutathione peroxidase 3E.S. Pilka, K. Guo, O. Gileadi, A. Rojkowa, F. Von Delft, A.C.W.Pike, K.L. Kavanagh, C. Johannson, M. Sundstrom, C.H. Arrowsmith, J. Weigel, T, A.M. Edwards, U. Oppermann Crystal structure of human glutathione peroxidase 3 (selenocysteine to glycine mutant). No recorded citation in PubMed Resolution 1.85 Angstroms.
113В02Transcriptional regulator, CRP family;Agari Y, Kuramitsu S, Shinkai A X-ray crystal structure of tthb099, a crp/fnr superfamily transcriptional regulator from thermus thermophilus hb8, reveals a DNA-binding protein with no required allosteric effector molecule. Proteins (2012), to be published. Resolution 1.92 Angstroms.
121BAS Fibroblast growth factor X. Zhu, H. Komiya, A. Chirino, S. Faham, G.M. Fox, T. Arakawa, B.T. Hsu, D.C. Rees Three-dimensional structures of acidic and basic fibroblast growth factors. Science V.251 90 1991. Astm Scieas US Issn 0036-8075 038 Resolution. 1.9 Angstroms.

Сведения о регистрации базы данных и программы, использованных в описании заявки

«База данных пентафрагментов белков».

Авторы: Карасев В.А., Беляев А.И., Лучинин В.В.

Свидетельство о государственной регистрации базы данных № 2010620364

Зарегистрировано в Реестре баз данных 7 июля 2010 г.

«Компьютерная программа для конструирования первичной структуры белка с заданной вторичной структурой» - «PROTCOM».

Авторы: Карасев В.А., Беляев А.И., Лучинин В.В.

Свидетельство о государственной регистрации программы для ЭВМ № 2011611105.

Зарегистрировано в Реестре программ для ЭВМ 2 февраля 2011 года.

Класс C12Q1/00 Способы измерения или испытания, использующие ферменты или микроорганизмы; составы для них; способы получения подобных составов

способ идентификации вызывающих муковисцидоз мутаций в гене cftr человека, набор праймеров, биочип, набор мишеней и тест-система, используемые в способе -  патент 2529717 (27.09.2014)
способ определения чувствительности патогенных бактерий к комплексным антибактериальным препаратам -  патент 2529711 (27.09.2014)
способ повышения чувствительности микроорганизмов к антимикробным препаратам -  патент 2529367 (27.09.2014)
бифазная транспортная питательная среда для выделения и выращивания бруцеллезного микроба -  патент 2529364 (27.09.2014)
аптамер, специфичный к опухолевым тканям легкого человека -  патент 2528870 (20.09.2014)
способ оценки выживаемости бифидо- и лактобактерий в желудочно-кишечном тракте экспериментальных животных -  патент 2528867 (20.09.2014)
способ выявления микобактерий туберкулеза генотипа веijing в режиме реального времени -  патент 2528866 (20.09.2014)
способ проведения пцр и пцр-пдрф для идентификации аллельных вариантов waxy-генов пшеницы -  патент 2528748 (20.09.2014)
синтетические олигонуклеотидные праймеры для идентификации вируса блютанга нуклеотипа в (3, 13 и 16 серотипы) методом от-пцр -  патент 2528745 (20.09.2014)
способ проведения пцр-пдрф для генотипирования крупного рогатого скота по аллелям а и к гена dgat1 -  патент 2528743 (20.09.2014)

Класс G06F17/00 Устройства или методы цифровых вычислений или обработки данных, специально предназначенные для специфических функций

способ и устройство отображения множества элементов -  патент 2528147 (10.09.2014)
устройство идентификации лагранжевых динамических систем на основе итерационной регуляризации -  патент 2528133 (10.09.2014)
интегрированная система сбора, контроля, обработки и регистрации полетной информации -  патент 2528092 (10.09.2014)
приемник импульсного сигнала -  патент 2528081 (10.09.2014)
система генерирования статистической информации и способ генерирования статистической информации -  патент 2527754 (10.09.2014)
поддержка быстрого слияния для устаревших документов -  патент 2527744 (10.09.2014)
система оповещения о программной ошибке и недостатке эффективности -  патент 2527208 (27.08.2014)
способ конверсии данных, устройство конверсии данных и система конверсии данных -  патент 2527201 (27.08.2014)
телекоммуникационная чип-карта, мобильное телефонное устройство и считываемый компьютером носитель данных -  патент 2527197 (27.08.2014)
контроллер распределения ресурсов -  патент 2526762 (27.08.2014)

Класс G06F19/10 биоинформатика, те способы или системы для обработки данных, связанных с генетикой или протеиновыми белками в компьютерной молекулярной биологии