stringtranslate.com

Моделирование гомологии

Гомологическая модель белка DHRS7B, созданная с помощью Swiss-model и визуализированная с помощью PyMOL

Моделирование гомологии , также известное как сравнительное моделирование белка, относится к построению модели атомного разрешения « целевого » белка из его аминокислотной последовательности и экспериментальной трехмерной структуры родственного гомологичного белка (« шаблона »). Моделирование гомологии основано на идентификации одной или нескольких известных структур белка, которые, вероятно, напоминают структуру последовательности запроса, и на создании выравнивания последовательностей , которое сопоставляет остатки в последовательности запроса с остатками в последовательности шаблона. Было замечено, что структуры белков более консервативны, чем последовательности белков среди гомологов, но последовательности, лежащие ниже 20% идентичности последовательности, могут иметь совершенно другую структуру. [1]

Эволюционно связанные белки имеют схожие последовательности, а встречающиеся в природе гомологичные белки имеют схожую структуру белка. Было показано, что трехмерная структура белка эволюционно более консервативна, чем можно было бы ожидать на основе только сохранения последовательности. [2]

Выравнивание последовательности и структура шаблона затем используются для создания структурной модели цели. Поскольку структуры белков более консервативны , чем последовательности ДНК, и обнаруживаемые уровни сходства последовательностей обычно подразумевают значительное структурное сходство. [3]

Качество модели гомологии зависит от качества выравнивания последовательности и структуры шаблона. Подход может быть осложнен наличием пробелов в выравнивании (обычно называемых инделями), которые указывают на структурную область, присутствующую в мишени, но не в шаблоне, и пробелами в структуре в шаблоне, которые возникают из-за плохого разрешения в экспериментальной процедуре (обычно рентгеновской кристаллографии ), используемой для решения структуры. Качество модели ухудшается с уменьшением идентичности последовательности ; типичная модель имеет среднеквадратичное отклонение ~1–2 Å между совпадающими атомами C α при 70% идентичности последовательности, но только 2–4 Å согласия при 25% идентичности последовательности. Однако ошибки значительно выше в областях петель, где аминокислотные последовательности целевых и шаблонных белков могут полностью отличаться.

Области модели, которые были построены без шаблона, обычно с помощью моделирования петель , как правило, гораздо менее точны, чем остальная часть модели. Ошибки в упаковке и положении боковой цепи также увеличиваются с уменьшением идентичности, и вариации в этих конфигурациях упаковки были предложены в качестве основной причины плохого качества модели при низкой идентичности. [4] В совокупности эти различные ошибки атомного положения являются значительными и затрудняют использование моделей гомологии для целей, требующих данных с атомным разрешением, таких как разработка лекарств и предсказания белок-белкового взаимодействия ; даже четвертичную структуру белка может быть трудно предсказать из моделей гомологии его субъединиц. Тем не менее, модели гомологии могут быть полезны для получения качественных выводов о биохимии последовательности запроса, особенно при формулировании гипотез о том, почему определенные остатки сохраняются, что, в свою очередь, может привести к экспериментам для проверки этих гипотез. Например, пространственное расположение консервативных остатков может указывать на то, сохраняется ли определенный остаток для стабилизации сворачивания, для участия в связывании некоторой малой молекулы или для содействия ассоциации с другим белком или нуклеиновой кислотой. [5]

Моделирование гомологии может производить высококачественные структурные модели, когда цель и шаблон тесно связаны, что вдохновило на создание консорциума структурной геномики, посвященного созданию репрезентативных экспериментальных структур для всех классов белковых складок. [6] Основные неточности в моделировании гомологии, которые ухудшаются с более низкой идентичностью последовательностей , возникают из-за ошибок в начальном выравнивании последовательностей и из-за неправильного выбора шаблона. [7] Как и другие методы прогнозирования структуры, текущая практика моделирования гомологии оценивается в двухгодичном крупномасштабном эксперименте, известном как Критическая оценка методов прогнозирования структуры белка или Критическая оценка прогнозирования структуры ( CASP ).

Мотив

Метод моделирования гомологии основан на наблюдении, что третичная структура белка лучше сохраняется, чем последовательность аминокислот . [3] Таким образом, даже белки, которые значительно разошлись в последовательности, но все еще имеют обнаруживаемое сходство, также будут иметь общие структурные свойства, в частности общую укладку. Поскольку получение экспериментальных структур с помощью таких методов, как рентгеновская кристаллография и ЯМР белка для каждого интересующего белка, является сложным и трудоемким, моделирование гомологии может предоставить полезные структурные модели для выдвижения гипотез о функции белка и направления дальнейшей экспериментальной работы.

Существуют исключения из общего правила, согласно которому белки, имеющие значительную идентичность последовательностей, будут иметь общую укладку. Например, разумно выбранный набор мутаций менее 50% белка может привести к тому, что белок примет совершенно другую укладку. [8] [9] Однако такая масштабная структурная перестройка вряд ли произойдет в ходе эволюции , особенно потому, что белок обычно находится под ограничением, что он должен правильно сворачиваться и выполнять свою функцию в клетке. Следовательно, грубо свернутая структура белка (его «топология») сохраняется дольше, чем его аминокислотная последовательность, и намного дольше, чем соответствующая последовательность ДНК; другими словами, два белка могут иметь похожую укладку, даже если их эволюционное родство настолько отдалено, что его невозможно надежно различить. Для сравнения, функция белка сохраняется гораздо меньше, чем последовательность белка, поскольку для принятия связанной функции требуется относительно немного изменений в аминокислотной последовательности.

Этапы производства модели

Процедуру моделирования гомологии можно разбить на четыре последовательных шага: выбор шаблона, выравнивание целевой модели, построение модели и оценка модели. [3] Первые два шага часто по сути выполняются вместе, поскольку наиболее распространенные методы идентификации шаблонов полагаются на создание выравниваний последовательностей; однако эти выравнивания могут быть недостаточно качественными, поскольку методы поиска в базе данных отдают приоритет скорости над качеством выравнивания. Эти процессы можно выполнять итеративно для улучшения качества конечной модели, хотя оценки качества, которые не зависят от истинной целевой структуры, все еще находятся в стадии разработки.

Оптимизация скорости и точности этих шагов для использования в крупномасштабном автоматизированном прогнозировании структур является ключевым компонентом инициатив структурной геномики, отчасти потому, что полученный объем данных будет слишком большим для ручной обработки, а отчасти потому, что цель структурной геномики требует предоставления моделей приемлемого качества исследователям, которые сами не являются экспертами в прогнозировании структур. [3]

Выбор шаблона и выравнивание последовательности

Критически важным первым шагом в моделировании гомологии является идентификация наилучшей структуры шаблона, если таковые имеются. Самый простой метод идентификации шаблона основан на серийных парных выравниваниях последовательностей с помощью методов поиска в базе данных, таких как FASTA и BLAST . Более чувствительные методы, основанные на множественном выравнивании последовательностей , из которых PSI-BLAST является наиболее распространенным примером, итеративно обновляют свою матрицу оценки, специфичную для позиции, для последовательной идентификации более отдаленно связанных гомологов. Было показано, что это семейство методов создает большее количество потенциальных шаблонов и определяет лучшие шаблоны для последовательностей, которые имеют только отдаленные отношения с любой решенной структурой. Белковая нить [10], также известная как распознавание складок или выравнивание 3D-1D, также может использоваться в качестве метода поиска для идентификации шаблонов, которые будут использоваться в традиционных методах моделирования гомологии. [3] Недавние эксперименты CASP показывают, что некоторые методы белковой нити, такие как RaptorX, более чувствительны, чем чисто основанные на последовательностях (профилях) методы, когда для прогнозируемых белков доступны только отдаленно связанные шаблоны. При выполнении поиска BLAST надежным первым подходом является выявление попаданий с достаточно низким значением E , которые считаются достаточно близкими в эволюции, чтобы создать надежную модель гомологии. Другие факторы могут склонить чашу весов в пограничных случаях; например, шаблон может иметь функцию, аналогичную функции последовательности запроса, или он может принадлежать к гомологичному оперону . Однако шаблон с плохим значением E , как правило, не следует выбирать, даже если он единственный доступный, поскольку он может иметь неправильную структуру, что приведет к созданию ошибочной модели. Лучший подход — отправить первичную последовательность на серверы распознавания сгибов [10] или, что еще лучше, на консенсусные метасерверы, которые улучшают отдельные серверы распознавания сгибов путем выявления сходств (консенсуса) среди независимых предсказаний.

Часто несколько шаблонных структур-кандидатов идентифицируются этими подходами. Хотя некоторые методы могут генерировать гибридные модели с большей точностью из нескольких шаблонов, [10] [11] большинство методов полагаются на один шаблон. Поэтому выбор лучшего шаблона из числа кандидатов является ключевым шагом и может существенно повлиять на окончательную точность структуры. Этот выбор определяется несколькими факторами, такими как сходство последовательностей запроса и шаблона, их функций и предсказанных вторичных структур запроса и наблюдаемых шаблонов . Возможно, самое важное — это покрытие выровненных областей: доля структуры последовательности запроса, которую можно предсказать из шаблона, и правдоподобность полученной модели. Таким образом, иногда для одной последовательности запроса создается несколько моделей гомологии, при этом наиболее вероятный кандидат выбирается только на последнем этапе.

Можно использовать выравнивание последовательностей, сгенерированное методом поиска в базе данных, в качестве основы для последующего создания модели; однако, были также исследованы более сложные подходы. Одно предложение генерирует ансамбль стохастически определенных парных выравниваний между целевой последовательностью и одним идентифицированным шаблоном в качестве средства исследования «пространства выравнивания» в областях последовательности с низким локальным сходством. [12] Выравнивания «профиль-профиль», которые сначала генерируют профиль последовательности цели и систематически сравнивают его с профилями последовательностей решенных структур; считается, что грубая зернистость, присущая построению профиля, снижает шум, вносимый дрейфом последовательности в несущественных областях последовательности. [13]

Генерация модели

При наличии шаблона и выравнивания, содержащаяся в нем информация должна использоваться для создания трехмерной структурной модели цели, представленной в виде набора декартовых координат для каждого атома в белке. Было предложено три основных класса методов создания моделей. [14] [15]

Сборка фрагмента

Первоначальный метод моделирования гомологии основывался на сборке полной модели из консервативных структурных фрагментов, идентифицированных в тесно связанных решенных структурах. Например, исследование моделирования сериновых протеаз у млекопитающих выявило резкое различие между «основными» структурными областями, сохраненными во всех экспериментальных структурах в классе, и вариабельными областями, обычно расположенными в петлях , где локализовано большинство различий последовательностей. Таким образом, нерешенные белки можно было смоделировать, сначала построив консервативное ядро, а затем заменив вариабельные области из других белков в наборе решенных структур. [16] Текущие реализации этого метода отличаются в основном тем, как они работают с областями, которые не являются консервативными или не имеют шаблона. [17] Вариабельные области часто конструируются с помощью библиотеки фрагментов белка .

Сопоставление сегментов

Метод сегментного сопоставления делит цель на ряд коротких сегментов, каждый из которых сопоставлен со своим собственным шаблоном, подобранным из Protein Data Bank . Таким образом, выравнивание последовательностей выполняется по сегментам, а не по всему белку. Выбор шаблона для каждого сегмента основан на сходстве последовательностей, сравнении координат альфа-углерода и прогнозируемых стерических конфликтах, возникающих из радиусов Ван-дер-Ваальса расходящихся атомов между целью и шаблоном. [18]

Удовлетворение пространственных ограничений

Наиболее распространенный в настоящее время метод моделирования гомологии черпает вдохновение из расчетов, необходимых для построения трехмерной структуры из данных, полученных с помощью ЯМР-спектроскопии . Одно или несколько выравниваний целевой шаблон используются для построения набора геометрических критериев, которые затем преобразуются в функции плотности вероятности для каждого ограничения. Ограничения, применяемые к основным внутренним координатам белка – расстояниям остова белка и двугранным углам – служат основой для глобальной процедуры оптимизации , которая изначально использовала минимизацию энергии сопряженного градиента для итеративного уточнения положений всех тяжелых атомов в белке. [19]

Этот метод был значительно расширен для применения специально к моделированию петель, что может быть чрезвычайно сложным из-за высокой гибкости петель в белках в водном растворе. [20] Более позднее расширение применяет модель пространственного ограничения к картам электронной плотности , полученным из исследований криоэлектронной микроскопии , которые предоставляют информацию с низким разрешением, которая сама по себе недостаточна для создания структурных моделей с атомным разрешением. [21] Для решения проблемы неточностей в исходном выравнивании последовательностей целевой матрицы также была введена итерационная процедура для уточнения выравнивания на основе исходного структурного соответствия. [22] Наиболее часто используемым программным обеспечением в моделировании на основе пространственного ограничения является MODELLER , и для надежных моделей, созданных с его помощью, была создана база данных под названием ModBase . [23]

Моделирование цикла

Области целевой последовательности, которые не выровнены с шаблоном, моделируются с помощью моделирования петель ; они наиболее подвержены серьезным ошибкам моделирования и встречаются с большей частотой, когда цель и шаблон имеют низкую идентичность последовательностей. Координаты несовпадающих участков, определенные программами моделирования петель, как правило, гораздо менее точны, чем полученные путем простого копирования координат известной структуры, особенно если петля длиннее 10 остатков. Первые два двугранных угла боковой цепи (χ 1 и χ 2 ) обычно можно оценить в пределах 30° для точной структуры основной цепи; однако более поздние двугранные углы, обнаруженные в более длинных боковых цепях, таких как лизин и аргинин , как известно, трудно предсказать. Более того, небольшие ошибки в χ 1 (и, в меньшей степени, в χ 2 ) могут вызывать относительно большие ошибки в положениях атомов на конце боковой цепи; такие атомы часто имеют функциональное значение, особенно когда они расположены вблизи активного сайта .

Оценка модели

Разработано большое количество методов выбора структуры, подобной нативной, из набора моделей. Функции оценки были основаны как на функциях энергии молекулярной механики (Lazaridis и Karplus 1999; Petrey и Honig 2000; Feig и Brooks 2002; Felts и др. 2002; Lee и Duan 2004), так и на статистических потенциалах (Sippl 1995; Melo и Feytmans 1998; Samudrala и Moult 1998; Rojnuckarin и Subramaniam 1999; Lu и Skolnick 2001; Wallqvist и др. 2002; Zhou и Zhou 2002), остаточных средах (Luthy и др. 1992; Eisenberg и др. 1997; Park и др. 1997; Summa и др. 2005), локальных взаимодействиях боковой цепи и основной цепи (Fang и Shortle 2005), свойства, зависящие от ориентации (Buchete et al. 2004a,b; Hamelryck 2005), оценки упаковки (Berglund et al. 2004), энергия сольватации (Petrey and Honig 2000; McConkey et al. 2003; Wallner and Elofsson 2003; Berglund et al. 2004), водородные связи (Kortemme et al. 2003) и геометрические свойства (Colovos and Yeates 1993; Kleywegt 2000; Lovell et al. 2003; Mihalek et al. 2003). Ряд методов объединяют различные потенциалы в глобальную оценку, обычно используя линейную комбинацию терминов (Kortemme et al. 2003; Tosatto 2005) или с помощью методов машинного обучения, таких как нейронные сети (Wallner and Elofsson 2003) и машины опорных векторов (SVM) (Eramian et al. 2006). Сравнения различных программ оценки качества глобальной модели можно найти в недавних работах Pettitt et al. (2005), Tosatto (2005) и Eramian et al. (2006).

Меньше работ было посвящено оценке локального качества моделей. Локальные оценки важны в контексте моделирования, поскольку они могут дать оценку надежности различных регионов прогнозируемой структуры. Эту информацию можно использовать, в свою очередь, для определения того, какие регионы следует уточнить, какие следует рассмотреть для моделирования с помощью нескольких шаблонов, а какие следует предсказать ab initio. Информацию о локальном качестве модели можно также использовать для уменьшения комбинаторной проблемы при рассмотрении альтернативных выравниваний; например, оценивая различные локальные модели по отдельности, придется строить меньше моделей (предполагая, что взаимодействия между отдельными регионами незначительны или могут быть оценены отдельно).

Одним из наиболее широко используемых методов локальной оценки является Verify3D (Luthy et al. 1992; Eisenberg et al. 1997), который объединяет вторичную структуру, доступность растворителя и полярность остаточных сред. ProsaII (Sippl 1993), который основан на комбинации парного статистического потенциала и сольватационного члена, также широко применяется при оценке моделей. Другие методы включают программу Errat (Colovos and Yeates 1993), которая рассматривает распределения несвязанных атомов в соответствии с типом атома и расстоянием, и метод энергетической деформации (Maiorov and Abagyan 1998), который использует различия от средних энергий остатков в различных средах, чтобы указать, какие части структуры белка могут быть проблемными. Melo и Feytmans (1998) используют атомный парный потенциал и поверхностный сольватационный потенциал (оба основаны на знаниях) для оценки структур белков. За исключением метода энергетической деформации, который является полуэмпирическим подходом, основанным на силовом поле ECEPP3 (Nemethy et al. 1992), все перечисленные выше локальные методы основаны на статистических потенциалах. Концептуально отличным подходом является метод ProQres, который был совсем недавно представлен Валлнером и Элофссоном (2006). ProQres основан на нейронной сети, которая объединяет структурные признаки для различения правильных и неправильных областей. Было показано, что ProQres превосходит более ранние методологии, основанные на статистических подходах (Verify3D, ProsaII и Errat). Данные, представленные в исследовании Валлнера и Элофссона, свидетельствуют о том, что их подход машинного обучения, основанный на структурных признаках, действительно превосходит методы, основанные на статистике. Однако основанные на знаниях методы, рассмотренные в их работе, Verify3D (Luthy et al. 1992; Eisenberg et al. 1997), Prosa (Sippl 1993) и Errat (Colovos and Yeates 1993), не основаны на новых статистических возможностях.

Бенчмаркинг

Было предпринято несколько крупномасштабных попыток сравнительного анализа для оценки относительного качества различных современных методов моделирования гомологии. Критическая оценка прогнозирования структуры ( CASP ) — это эксперимент по прогнозированию, охватывающий все сообщество, который проводится каждые два года в летние месяцы и требует от команд прогнозирования представить структурные модели для ряда последовательностей, структуры которых были недавно экспериментально решены, но еще не опубликованы. Его партнер Критическая оценка полностью автоматизированного прогнозирования структуры ( CAFASP ) работает параллельно с CASP, но оценивает только модели, созданные с помощью полностью автоматизированных серверов. Постоянно выполняемые эксперименты, не имеющие «сезонов» прогнозирования, в основном сосредоточены на сравнительном анализе общедоступных веб-серверов. LiveBench и EVA работают непрерывно для оценки производительности участвующих серверов в прогнозировании структур, которые вскоре будут выпущены из PDB. CASP и CAFASP служат в основном для оценки состояния дел в моделировании, в то время как непрерывные оценки направлены на оценку качества модели, которое может быть получено неспециалистом, использующим общедоступные инструменты.

Точность

Точность структур, полученных с помощью моделирования гомологии, в значительной степени зависит от идентичности последовательностей между мишенью и шаблоном. При идентичности последовательностей выше 50% модели, как правило, надежны, с небольшими ошибками в упаковке боковой цепи и ротамерном состоянии, а общее среднеквадратичное отклонение между смоделированной и экспериментальной структурой составляет около 1 Å . Эта ошибка сопоставима с типичным разрешением структуры, полученной с помощью ЯМР. В диапазоне идентичности 30–50% ошибки могут быть более серьезными и часто локализуются в петлях. При идентичности ниже 30% возникают серьезные ошибки, иногда приводящие к неправильному предсказанию базовой складки. [14] Эту область с низкой идентичностью часто называют «сумеречной зоной», в пределах которой моделирование гомологии чрезвычайно сложно и для которой оно, возможно, менее пригодно, чем методы распознавания складки . [24]

При высоких идентичностях последовательностей основной источник ошибок в моделировании гомологии вытекает из выбора шаблона или шаблонов, на которых основана модель, в то время как при низких идентичностях наблюдаются серьезные ошибки в выравнивании последовательностей, которые препятствуют созданию высококачественных моделей. [7] Было высказано предположение, что основным препятствием для создания качественной модели является неадекватность выравнивания последовательностей, поскольку «оптимальные» структурные выравнивания между двумя белками известной структуры могут использоваться в качестве входных данных для современных методов моделирования для создания довольно точных воспроизведений исходной экспериментальной структуры. [25]

Были предприняты попытки улучшить точность моделей гомологии, построенных с помощью существующих методов, подвергая их молекулярно-динамическому моделированию в попытке улучшить их RMSD для экспериментальной структуры. Однако текущие параметризации силового поля могут быть недостаточно точными для этой задачи, поскольку модели гомологии, используемые в качестве исходных структур для молекулярной динамики, имеют тенденцию производить немного худшие структуры. [26] Небольшие улучшения наблюдались в случаях, когда во время моделирования использовались значительные ограничения. [27]

Источники ошибок

Два наиболее распространенных и масштабных источника ошибок в моделировании гомологии — это плохой выбор шаблона и неточности в выравнивании последовательностей целевой шаблон. [7] [28] Контроль этих двух факторов с помощью структурного выравнивания или выравнивания последовательностей, произведенного на основе сравнения двух решенных структур, значительно снижает ошибки в конечных моделях; эти «золотые стандартные» выравнивания могут использоваться в качестве входных данных для текущих методов моделирования для получения довольно точных воспроизведений исходной экспериментальной структуры. [25] Результаты последнего эксперимента CASP показывают, что «консенсусные» методы, собирающие результаты распознавания множественных складок и поиска множественных выравниваний, увеличивают вероятность идентификации правильного шаблона; аналогично, использование нескольких шаблонов на этапе построения модели может быть хуже, чем использование одного правильного шаблона, но лучше, чем использование одного субоптимального. [28] Ошибки выравнивания могут быть минимизированы с помощью использования множественного выравнивания, даже если используется только один шаблон, и итеративного уточнения локальных областей с низким сходством. [3] [12] Менее значительным источником ошибок модели являются ошибки в структуре шаблона. В PDBREPORT, заархивированном 31 мая 2007 г. в базе данных Wayback Machine , перечислено несколько миллионов, в основном очень небольших, но иногда существенных, ошибок в экспериментальных (шаблонных) структурах, которые были помещены в PDB .

Серьезные локальные ошибки могут возникать в моделях гомологии, где мутация вставки или делеции или пробел в решенной структуре приводят к области целевой последовательности, для которой нет соответствующего шаблона. Эту проблему можно свести к минимуму путем использования нескольких шаблонов, но метод усложняется различными локальными структурами шаблонов вокруг пробела и вероятностью того, что отсутствующий регион в одной экспериментальной структуре также отсутствует в других структурах того же семейства белков. Отсутствующие регионы чаще всего встречаются в петлях , где высокая локальная гибкость увеличивает сложность разрешения региона методами определения структуры. Хотя некоторые указания предоставляются даже с одним шаблоном путем позиционирования концов отсутствующего региона, чем длиннее пробел, тем сложнее его моделировать. Петли до примерно 9 остатков можно моделировать с умеренной точностью в некоторых случаях, если локальное выравнивание правильно. [3] Более крупные регионы часто моделируются индивидуально с использованием методов прогнозирования структуры ab initio , хотя этот подход имел лишь единичный успех. [29]

Ротамерные состояния боковых цепей и их внутренняя упаковка также представляют трудности в моделировании гомологии, даже в мишенях, для которых структура основной цепи относительно легко предсказать. Это отчасти связано с тем, что многие боковые цепи в кристаллических структурах не находятся в своем «оптимальном» ротамерном состоянии из-за энергетических факторов в гидрофобном ядре и в упаковке отдельных молекул в кристалле белка. [30] Один из методов решения этой проблемы требует поиска в ротамерной библиотеке для определения локально низкоэнергетических комбинаций состояний упаковки. [31] Было высказано предположение, что основной причиной того, что моделирование гомологии настолько сложно, когда идентичность последовательности мишени-шаблона составляет менее 30%, является то, что такие белки имеют в целом схожие складки, но сильно различающиеся упаковки боковых цепей. [4]

Утилита

Использование структурных моделей включает предсказание взаимодействия белок-белок , стыковку белок-белок , молекулярную стыковку и функциональную аннотацию генов, идентифицированных в геноме организма . [32] Даже модели гомологии с низкой точностью могут быть полезны для этих целей, поскольку их неточности, как правило, локализуются в петлях на поверхности белка, которые обычно более изменчивы даже между близкородственными белками. Функциональные области белка, особенно его активный сайт , как правило, более высококонсервативны и, таким образом, более точно моделируются. [14]

Гомологические модели также могут использоваться для выявления тонких различий между родственными белками, которые не все были решены структурно. Например, этот метод использовался для выявления участков связывания катионов на Na + /K + АТФазе и для выдвижения гипотез о связывающей аффинности различных АТФаз. [33] Используемые в сочетании с моделированием молекулярной динамики , гомологические модели также могут генерировать гипотезы о кинетике и динамике белка, как в исследованиях ионной селективности калиевого канала . [34] Крупномасштабное автоматизированное моделирование всех идентифицированных областей кодирования белков в геноме было предпринято для дрожжей Saccharomyces cerevisiae , в результате чего было получено около 1000 качественных моделей для белков, структуры которых еще не были определены на момент исследования, и выявлены новые связи между 236 дрожжевыми белками и другими ранее решенными структурами. [35]

Смотрите также

Ссылки

  1. ^ Chothia, C; Lesk, AM (1986). «Связь между расхождением последовательности и структуры в белках». EMBO J . 5 (4): 823–6. doi :10.1002/j.1460-2075.1986.tb04288.x. PMC  1166865 . PMID  3709526.
  2. ^ Качановски, С.; Зеленкевич, П. (2010). «Почему похожие последовательности белков кодируют похожие трехмерные структуры?» (PDF) . Теоретические химические отчеты . 125 (3–6): 643–50. doi :10.1007/s00214-009-0656-3. S2CID  95593331.
  3. ^ abcdefg Марти-Реном, MA; Стюарт, AC; Фисер, A; Санчес, R; Мело, F; Сали, A. (2000). «Сравнительное моделирование структуры белков генов и геномов». Annu Rev Biophys Biomol Struct . 29 : 291–325. doi :10.1146/annurev.biophys.29.1.291. PMID  10940251. S2CID  11498685.
  4. ^ ab Chung SY, Subbiah S. (1996.) Структурное объяснение сумеречной зоны гомологии белковых последовательностей. Структура 4: 1123–27.
  5. ^ Юсиф, Рагхид Хусам и др. «Изучение молекулярных взаимодействий между неокулином и рецепторами сладкого вкуса человека с помощью вычислительных подходов». Sains Malaysiana 49.3 (2020): 517-525. APA
  6. ^ Williamson AR (2000). «Создание консорциума структурной геномики». Nat Struct Biol . 7 (S1(11s)): 953. doi : 10.1038/80726 . PMID  11103997. S2CID  35185565.
  7. ^ abc Venclovas C, Margeleviĉius M (2005). «Сравнительное моделирование в CASP6 с использованием консенсусного подхода к выбору шаблона, выравниванию последовательности и структуры и оценке структуры». Proteins . 61 (S7): 99–105. doi :10.1002/prot.20725. PMID  16187350. S2CID  45345271.
  8. ^ Далал, С; Баласубраманиан, С; Реган, Л (1997). «Трансмутация альфа-спиралей и бета-слоев». Fold Des . 2 (5): R71–9. doi :10.1016/s1359-0278(97)00036-9. PMID  9377709.
  9. ^ Далал, С; Баласубраманиан, С; Реган, Л. (1997). «Белковая алхимия: изменение бета-слоя в альфа-спираль». Nat Struct Biol . 4 (7): 548–52. doi :10.1038/nsb0797-548. PMID  9228947. S2CID  5608132.
  10. ^ abc Peng, Jian; Jinbo Xu (2011). «RaptorX: использование структурной информации для выравнивания белков с помощью статистического вывода». Proteins . 79 (Suppl 10): 161–71. doi :10.1002/prot.23175. PMC 3226909 . PMID  21987485. 
  11. ^ Пэн, Цзянь; Цзиньбо Сюй (апрель 2011 г.). «подход с несколькими шаблонами к нитям белков». Белки . 79 (6): 1930–1939. doi :10.1002/prot.23016. PMC 3092796 . PMID  21465564. 
  12. ^ ab Muckstein, U; Hofacker, IL; Stadler, PF (2002). «Стохастические попарные выравнивания». Биоинформатика . 18 (Приложение 2): S153–60. doi : 10.1093/bioinformatics/18.suppl_2.S153 . PMID  12385998.
  13. ^ Рыхлевский, Л.; Чжан, Б.; Годзик, А. (1998). «Прогнозы сгиба и функции для белков Mycoplasma genitalium». Fold Des . 3 (4): 229–38. doi :10.1016/S1359-0278(98)00034-0. PMID  9710568.
  14. ^ abc Бейкер, Д.; Сали, А. (2001). «Предсказание структуры белка и структурная геномика». Science . 294 (5540): 93–96. Bibcode :2001Sci...294...93B. doi :10.1126/science.1065659. PMID  11588250. S2CID  7193705.
  15. ^ Чжан И (2008). «Прогресс и проблемы в предсказании структуры белка». Curr Opin Struct Biol . 18 (3): 342–348. doi :10.1016/j.sbi.2008.02.004. PMC 2680823. PMID  18436442 . 
  16. ^ Грир, Дж. (1981). «Сравнительное построение модели сериновых протеаз млекопитающих». Журнал молекулярной биологии . 153 (4): 1027–42. doi :10.1016/0022-2836(81)90465-4. PMID  7045378.
  17. ^ Wallner, B; Elofsson, A (2005). «Все не равны: эталон различных программ моделирования гомологии». Protein Science . 14 (5): 1315–1327. doi :10.1110/ps.041253405. PMC 2253266 . PMID  15840834. 
  18. ^ Левитт, М. (1992). «Точное моделирование конформации белка путем автоматического сопоставления сегментов». J Mol Biol . 226 (2): 507–33. doi : 10.1016/0022-2836(92)90964-L . PMID  1640463.
  19. ^ Сали, А.; Бланделл, Т.Л. (1993). «Сравнительное моделирование белков путем удовлетворения пространственных ограничений». J Mol Biol . 234 (3): 779–815. doi :10.1006/jmbi.1993.1626. PMID  8254673.
  20. ^ Fiser, A; Sali, A. (2003). «ModLoop: автоматизированное моделирование петель в белковых структурах». Биоинформатика . 19 (18): 2500–1. doi : 10.1093/bioinformatics/btg362 . PMID  14668246.
  21. ^ Топф, М.; Бейкер, М.Л.; Марти-Реном, МА; Чиу, В.; Сали, А. (2006). «Уточнение структур белков с помощью итеративного сравнительного моделирования и подгонки плотности криоЭМ». J Mol Biol . 357 (5): 1655–68. doi :10.1016/j.jmb.2006.01.062. PMID  16490207.
  22. ^ Джон, Б.; Сали, А. (2003). «Сравнительное моделирование структуры белка с помощью итеративного выравнивания, построения модели и оценки модели». Nucleic Acids Res . 31 (14): 3982–92. doi :10.1093/nar/gkg460. PMC 165975. PMID  12853614 . 
  23. ^ Урсула Пипер, Нараянан Эсвар, Ханнес Браберг, М. С. Мадхусудхан, Фред Дэвис, Эшли К. Стюарт, Небойша Миркович, Андреа Росси, Марк А. Марти-Реном, Андраш Фисер, Бен Уэбб, Дэниел Гринблатт, Конрад Хуан, Том Феррин, Андрей Сали. MODBASE, база данных аннотированных сравнительных моделей структуры белков и связанных с ними ресурсов. Nucleic Acids Res 32, D217-D222, 2004.
  24. ^ Блейк, Дж. Д.; Коэн, Ф. Э. (2001). «Парное выравнивание последовательностей ниже сумеречной зоны». J Mol Biol . 307 (2): 721–35. doi :10.1006/jmbi.2001.4495. PMID  11254392.
  25. ^ ab Zhang, Y; Skolnick, J. (2005). «Проблема предсказания структуры белка может быть решена с использованием текущей библиотеки PDB». Proc. Natl. Acad. Sci. USA . 102 (4): 1029–34. Bibcode :2005PNAS..102.1029Z. doi : 10.1073/pnas.0407152101 . PMC 545829 . PMID  15653774. 
  26. ^ Koehl, P; Levitt, M. (1999). «Более светлое будущее для предсказания структуры белка». Nat Struct Biol . 6 (2): 108–11. doi :10.1038/5794. PMID  10048917. S2CID  3162636.
  27. ^ Flohil, JA; Vriend, G; Berendsen, HJ. (2002). «Завершение и уточнение 3-мерных моделей гомологии с ограниченной молекулярной динамикой: применение к целям 47, 58 и 111 в соревновании по моделированию CASP и апостериорном анализе». Белки . 48 (4): 593–604. doi :10.1002/prot.10105. PMID  12211026. S2CID  11280977.
  28. ^ ab Ginalski, K. (2006). «Сравнительное моделирование для предсказания структуры белка». Curr Opin Struct Biol . 16 (2): 172–7. doi :10.1016/j.sbi.2006.02.003. PMID  16510277.
  29. ^ Криштафович А., Венцловас С., Фиделис К., Молт Дж. (2005). Прогресс за первое десятилетие экспериментов CASP. Белки 61(S7):225–36.
  30. ^ Васкес, М. (1996). «Моделирование конформации боковой цепи». Curr Opin Struct Biol . 6 (2): 217–21. doi :10.1016/S0959-440X(96)80077-7. PMID  8728654.
  31. ^ Wilson, C; Gregoret, LM; Agard, DA. (1993). «Моделирование конформации боковой цепи для гомологичных белков с использованием поиска ротамера на основе энергии». J Mol Biol . 229 (4): 996–1006. doi :10.1006/jmbi.1993.1100. PMID  8445659.
  32. ^ Гопал, С; Шредер, М; Пипер, Ю; Щирба, А; Айтекин-Курбан, Г; Бекиранов С; Фахардо, Дж. Э.; Эсвар, Н; Санчес, Р; и др. (2001). «Аннотация на основе гомологии дает 1042 новых гена-кандидата в геноме Drosophila melanogaster». Нат Жене . 27 (3): 337–40. дои : 10.1038/85922. PMID  11242120. S2CID  2144435.
  33. ^ Огава, Х.; Тоёсима, К. (2002). «Моделирование гомологии участков связывания катионов Na+K+-АТФазы». Proc Natl Acad Sci USA . 99 (25): 15977–15982. Bibcode : 2002PNAS ...9915977O. doi : 10.1073/pnas.202622299 . PMC 138550. PMID  12461183. 
  34. ^ Capener, CE; Shrivastava, IH; Ranatunga, KM; Forrest, LR; Smith, GR; Sansom, MSP (2000). "Моделирование гомологии и молекулярно-динамические исследования калиевого канала внутреннего выпрямителя". Biophys J . 78 (6): 2929–2942. Bibcode :2000BpJ....78.2929C. doi :10.1016/S0006-3495(00)76833-0. PMC 1300878 . PMID  10827973. 
  35. ^ Санчес, Р.; Сали, А. (1998). «Масштабное моделирование структуры белка генома Saccharomyces cerevisiae». Proc Natl Acad Sci USA . 95 (23): 13597–13602. Bibcode : 1998PNAS...9513597S. doi : 10.1073/pnas.95.23.13597 . PMC 24864. PMID  9811845 .