Гомологическое моделирование

Моделирование гомологии , также известное как сравнительное моделирование белка, относится к построению модели « мишени » белка с атомным разрешением на основе его аминокислотной последовательности и экспериментальной трехмерной структуры родственного гомологичного белка (« матрицы »). Моделирование гомологии основано на идентификации одной или нескольких известных белковых структур, которые могут напоминать структуру запрашиваемой последовательности, а также на создании выравнивания, которое сопоставляет остатки в запрашиваемой последовательности с остатками в матричной последовательности. Было замечено, что структуры белков более консервативны, чем последовательности белков среди гомологов, но последовательности, идентичность которых ниже 20%, могут иметь совершенно другую структуру. ^[1]

Эволюционно родственные белки имеют сходные последовательности, а встречающиеся в природе гомологичные белки имеют сходную белковую структуру. Было показано, что трехмерная структура белка эволюционно более консервативна, чем можно было бы ожидать, исходя только из сохранения последовательности. ^[2]

Выравнивание последовательностей и структура шаблона затем используются для создания структурной модели мишени. Потому что структуры белков более консервативны , чем последовательности ДНК, и обнаруживаемые уровни сходства последовательностей обычно подразумевают значительное структурное сходство. ^[3]

Качество модели гомологии зависит от качества выравнивания последовательностей и структуры матрицы. Подход может быть осложнен наличием пробелов в выравнивании (обычно называемых инделами), которые указывают на структурную область, присутствующую в мишени, но не в шаблоне, а также из-за структурных пробелов в шаблоне, которые возникают из-за плохого разрешения в экспериментальной процедуре (обычно X -лучевая кристаллография ), используемая для решения структуры. Качество модели снижается с уменьшением идентичности последовательностей ; типичная модель имеет среднеквадратическое отклонение ~ 1–2 Å между совпадающими атомами C ^α при 70% идентичности последовательности, но согласие только 2–4 Å при 25% идентичности последовательности. Однако ошибки существенно выше в петлевых участках, где аминокислотные последовательности белков-мишеней и матричных белков могут совершенно различаться.

Области модели, построенные без шаблона, обычно с помощью петлевого моделирования , обычно гораздо менее точны, чем остальная часть модели. Ошибки в упаковке и положении боковой цепи также увеличиваются с уменьшением идентичности, и вариации в этих конфигурациях упаковки были предложены как основная причина плохого качества модели при низкой идентичности. ^[4] В совокупности эти различные ошибки положения атомов являются значительными и препятствуют использованию моделей гомологии для целей, требующих данных с атомным разрешением, таких как разработка лекарств и прогнозирование белок-белковых взаимодействий ; даже четвертичную структуру белка может быть трудно предсказать на основе моделей гомологии его субъединицы (субъединиц). Тем не менее, модели гомологии могут быть полезны для получения качественных выводов о биохимии запрашиваемой последовательности, особенно при формулировании гипотез о том, почему определенные остатки консервативны, что, в свою очередь, может привести к экспериментам для проверки этих гипотез. Например, пространственное расположение консервативных остатков может указывать на то, консервативен ли конкретный остаток для стабилизации сворачивания, для участия в связывании какой-либо небольшой молекулы или для содействия ассоциации с другим белком или нуклеиновой кислотой.

Моделирование гомологии может создавать высококачественные структурные модели, когда мишень и матрица тесно связаны, что вдохновило на создание консорциума структурной геномики , занимающегося созданием репрезентативных экспериментальных структур для всех классов белковых складок. ^[5] Основные неточности в моделировании гомологии, которые ухудшаются при более низкой идентичности последовательностей , возникают из-за ошибок в первоначальном выравнивании последовательностей и неправильного выбора матрицы. ^[6] Как и другие методы прогнозирования структуры, текущая практика моделирования гомологии оценивается в ходе крупномасштабного эксперимента, проводимого раз в два года, известного как Критическая оценка методов прогнозирования структуры белка или CASP .

Мотив

Метод моделирования гомологии основан на наблюдении, что третичная структура белка более консервативна, чем аминокислотная последовательность . ^[3] Таким образом, даже белки, которые значительно различаются по последовательности, но все еще имеют обнаруживаемое сходство, также будут иметь общие структурные свойства, особенно общую складку. Поскольку получение экспериментальных структур с помощью таких методов, как рентгеновская кристаллография и ЯМР белков, для каждого интересующего белка сложно и требует много времени, моделирование гомологии может предоставить полезные структурные модели для создания гипотез о функции белка и направления дальнейшей экспериментальной работы.

Существуют исключения из общего правила, согласно которому белки, имеющие значительную идентичность последовательностей, будут иметь общую складку. Например, разумно выбранный набор мутаций, составляющий менее 50% белка, может привести к тому, что белок примет совершенно другую складку. ^[7]^[8] Однако такая массивная структурная перестройка вряд ли произойдет в ходе эволюции , тем более что белок обычно находится под ограничением, заключающимся в том, что он должен правильно сворачиваться и выполнять свою функцию в клетке. Следовательно, грубо свернутая структура белка (его «топология») сохраняется дольше, чем его аминокислотная последовательность, и намного дольше, чем соответствующая последовательность ДНК; другими словами, два белка могут иметь схожую структуру, даже если их эволюционное родство настолько далеко, что его невозможно надежно различить. Для сравнения: функция белка консервативна гораздо меньше , чем последовательность белка, поскольку для выполнения соответствующей функции требуется относительно небольшое количество изменений в аминокислотной последовательности.

Этапы изготовления модели

Процедуру моделирования гомологии можно разбить на четыре последовательных этапа: выбор шаблона, согласование целевого шаблона, построение модели и оценка модели. ^[3] Первые два шага часто выполняются вместе, поскольку наиболее распространенные методы идентификации шаблонов основаны на выравнивании последовательностей; однако качество этого выравнивания может быть недостаточным, поскольку методы поиска в базе данных отдают приоритет скорости, а не качеству выравнивания. Эти процессы можно выполнять итеративно для улучшения качества окончательной модели, хотя оценки качества, не зависящие от истинной целевой структуры, все еще находятся в стадии разработки.

Оптимизация скорости и точности этих шагов для использования в крупномасштабном автоматизированном прогнозировании структуры является ключевым компонентом инициатив в области структурной геномики, отчасти потому, что полученный объем данных будет слишком большим для обработки вручную, а отчасти потому, что цель структурной геномики требует предоставления модели приемлемого качества для исследователей, которые сами не являются экспертами по предсказанию структур. ^[3]

Выбор шаблона и выравнивание последовательности

Важнейшим первым шагом в моделировании гомологии является идентификация лучшей структуры шаблона, если таковая вообще существует. Самый простой метод идентификации шаблона основан на последовательном парном выравнивании последовательностей с помощью методов поиска в базе данных, таких как FASTA и BLAST . Более чувствительные методы, основанные на множественном выравнивании последовательностей , наиболее распространенным примером которых является PSI-BLAST , итеративно обновляют свою оценочную матрицу для конкретной позиции, чтобы последовательно идентифицировать более отдаленно родственные гомологи. Было показано, что это семейство методов создает большее количество потенциальных шаблонов и идентифицирует лучшие шаблоны для последовательностей, которые имеют лишь отдаленное отношение к любой решенной структуре. Протезирование белков ^[9] , также известное как распознавание складок или выравнивание 3D-1D, также может использоваться в качестве метода поиска для идентификации шаблонов, которые будут использоваться в традиционных методах моделирования гомологии. ^[3] Недавние эксперименты CASP показывают, что некоторые методы нарезки белков, такие как RaptorX, действительно более чувствительны, чем методы, основанные исключительно на последовательностях (профилях), когда для прогнозируемых белков доступны только отдаленно связанные матрицы. При выполнении поиска BLAST надежным первым подходом является идентификация совпадений с достаточно низким значением E , которые считаются достаточно близкими в эволюции, чтобы создать надежную модель гомологии. Другие факторы могут склонить чашу весов в крайних случаях; например, шаблон может иметь функцию, аналогичную функции последовательности запроса, или может принадлежать гомологическому оперону . Однако шаблон с плохим значением E обычно не следует выбирать, даже если он единственный доступный, поскольку он вполне может иметь неправильную структуру, что приведет к созданию ошибочной модели. Лучшим подходом является передача первичной последовательности на серверы распознавания фолдов ^[9] или, что еще лучше, на консенсусные метасерверы, которые улучшают работу отдельных серверов распознавания фолдов за счет выявления сходства (консенсуса) между независимыми предсказаниями.

Часто с помощью этих подходов выявляются несколько структур-кандидатов шаблонов. Хотя некоторые методы могут генерировать гибридные модели с большей точностью на основе нескольких шаблонов, ^[9]^[10] большинство методов полагаются на один шаблон. Таким образом, выбор лучшего шаблона среди кандидатов является ключевым шагом и может существенно повлиять на конечную точность структуры. Этот выбор определяется несколькими факторами, такими как сходство последовательностей запроса и шаблона, их функций, а также прогнозируемого запроса и наблюдаемых вторичных структур шаблона . Возможно, наиболее важным является охват выровненных регионов: доля структуры последовательности запроса, которую можно предсказать на основе шаблона, и правдоподобие полученной модели. Таким образом, иногда для одной последовательности запроса создается несколько моделей гомологии, причем наиболее вероятный кандидат выбирается только на последнем этапе.

Можно использовать выравнивание последовательностей, полученное с помощью метода поиска в базе данных, в качестве основы для последующего создания модели; однако были изучены и более сложные подходы. Одно предложение генерирует ансамбль стохастически определенных парных выравниваний между целевой последовательностью и единственной идентифицированной матрицей как средство исследования «пространства выравнивания» в областях последовательности с низким локальным сходством. ^[11] Выравнивания «профиль-профиль», которые сначала генерируют профиль последовательности мишени и систематически сравнивают его с профилями последовательностей решенных структур; Считается, что крупнозернистость, присущая конструкции профиля, снижает шум, вносимый дрейфом последовательности в несущественных областях последовательности. ^[12]

Генерация модели

Учитывая шаблон и выравнивание, содержащаяся в нем информация должна использоваться для создания трехмерной структурной модели мишени, представленной как набор декартовых координат для каждого атома в белке. Были предложены три основных класса методов генерации моделей. ^[13]^[14]

Сборка фрагментов

Оригинальный метод моделирования гомологии основывался на сборке полной модели из консервативных структурных фрагментов, идентифицированных в близкородственных решенных структурах. Например, моделирование сериновых протеаз у млекопитающих выявило резкое различие между «основными» структурными областями, консервативными во всех экспериментальных структурах класса, и вариабельными областями, обычно расположенными в петлях , где локализовано большинство различий последовательностей. Таким образом, нерешенные белки можно было смоделировать, сначала построив консервативное ядро, а затем заменив вариабельные области других белков в наборе решенных структур. ^[15] Текущие реализации этого метода различаются главным образом тем, как они работают с несохраняемыми регионами или регионами, в которых отсутствует шаблон. ^[16] Вариабельные регионы часто создаются с помощью библиотек фрагментов .

Сопоставление сегментов

Метод сопоставления сегментов делит цель на ряд коротких сегментов, каждый из которых сопоставляется со своим собственным шаблоном, взятым из банка данных белков . Таким образом, выравнивание последовательностей осуществляется по сегментам, а не по всему белку. Выбор матрицы для каждого сегмента основан на сходстве последовательностей, сравнении координат альфа-углерода и предсказанных стерических конфликтах, возникающих из-за ван-дер-ваальсовых радиусов расходящихся атомов между мишенью и матрицей. ^[17]

Удовлетворение пространственных ограничений

Самый распространенный современный метод моделирования гомологии основан на расчетах, необходимых для построения трехмерной структуры на основе данных, полученных с помощью ЯМР-спектроскопии . Одно или несколько выравниваний целевого шаблона используются для построения набора геометрических критериев, которые затем преобразуются в функции плотности вероятности для каждого ограничения. Ограничения, применяемые к основным внутренним координатам белка — расстояниям между остовами белка и двугранным углам — служат основой для процедуры глобальной оптимизации , которая первоначально использовала минимизацию энергии сопряженного градиента для итеративного уточнения положений всех тяжелых атомов в белке. ^[18]

Этот метод был значительно расширен и стал применяться специально для моделирования петель, что может быть чрезвычайно сложно из-за высокой гибкости петель в белках в водном растворе. ^[19] Более позднее расширение применяет модель пространственных ограничений к картам электронной плотности , полученным в результате исследований криоэлектронной микроскопии , которые предоставляют информацию с низким разрешением, которая сама по себе обычно недостаточна для создания структурных моделей атомного разрешения. ^[20] Чтобы решить проблему неточностей в первоначальном выравнивании последовательностей целевой матрицы, была также введена итерационная процедура для уточнения выравнивания на основе первоначального структурного соответствия. ^[21] Наиболее часто используемым программным обеспечением для моделирования на основе пространственных ограничений является MODELLER , и для надежных моделей, созданных с его помощью, создана база данных ModBase . ^[22]

Моделирование цикла

Области целевой последовательности, которые не совпадают с матрицей, моделируются с помощью петлевого моделирования ; они наиболее подвержены серьезным ошибкам моделирования и возникают с большей частотой, когда мишень и матрица имеют низкую идентичность последовательностей. Координаты несовпадающих участков, определенные с помощью программ моделирования петель, обычно гораздо менее точны, чем координаты, полученные путем простого копирования координат известной структуры, особенно если длина петли превышает 10 остатков. Первые два двугранных угла боковой цепи (χ ₁ и χ ₂ ) обычно можно оценить в пределах 30° для точной структуры основной цепи; однако более поздние двугранные углы, обнаруженные в более длинных боковых цепях, таких как лизин и аргинин , как известно, трудно предсказать. Более того, небольшие ошибки в χ ₁ (и, в меньшей степени, в χ ₂ ) могут вызывать относительно большие ошибки в положениях атомов на конце боковой цепи; такие атомы часто имеют функциональное значение, особенно когда они расположены вблизи активного центра .

Оценка модели

Разработано большое количество методов выбора нативной структуры из набора моделей. Функции оценки были основаны как на энергетических функциях молекулярной механики (Лазаридис и Карплюс, 1999; Петри и Хониг, 2000; Фейг и Брукс, 2002; Фелтс и др., 2002; Ли и Дуан, 2004), так и на статистических потенциалах (Сиппл, 1995; Мело и Фейтманс, 1998; Samudrala and Moult 1998; Rojnuckarin and Subramaniam 1999; Lu and Skolnick 2001; Wallqvist et al. 2002; остаточная среда (Luthy et al. 1992; Eisenberg et al. 1997; Park et al. 1997; Summa et al. al. 2005), локальные взаимодействия боковой и основной цепи (Fang and Shortle 2005), свойства, зависящие от ориентации (Buchete et al. 2004a,b; Hamelryck 2005), оценки упаковки (Berglund et al. 2004), энергия сольватации (Petrey). и Хониг и др., 2003; Уолнер и Элофссон, 2003; Берглунд и др., 2004), водородная связь (Кортемме и др., 2003) и геометрические свойства (Коловос и Йейтс, 1993; Клейвегт, 2000; Ловелл и др., 2003); Михалек и др. 2003). Ряд методов объединяют различные потенциалы в глобальную оценку, обычно используя линейную комбинацию терминов (Kortemme et al. 2003; Tosatto 2005) или с помощью методов машинного обучения, таких как нейронные сети (Wallner and Elofsson 2003) и машины опорных векторов (SVM) (Eramian et al. 2006). Сравнение различных программ оценки качества глобальных моделей можно найти в недавних работах Pettitt et al. (2005), Тосатто (2005) и Эрамиан и др. (2006).

Сообщается о меньшей работе по местной оценке качества моделей. Локальные оценки важны в контексте моделирования, поскольку они могут дать оценку надежности различных областей прогнозируемой структуры. Эту информацию, в свою очередь, можно использовать для определения того, какие регионы следует уточнить, какие следует учитывать при моделировании с помощью нескольких шаблонов, а какие следует прогнозировать ab initio. Информация о качестве локальной модели также может быть использована для уменьшения комбинаторной проблемы при рассмотрении альтернативных выравниваний; например, если оценивать различные локальные модели отдельно, потребуется построить меньше моделей (при условии, что взаимодействия между отдельными регионами незначительны или могут быть оценены отдельно).

Одним из наиболее широко используемых методов локальной оценки является Verify3D (Luthy et al. 1992; Eisenberg et al. 1997), который сочетает в себе вторичную структуру, доступность растворителя и полярность окружения остатков. ProsaII (Sippl 1993), основанный на сочетании парного статистического потенциала и сольватационного члена, также широко применяется при оценке моделей. Другие методы включают программу Errat (Коловос и Йейтс, 1993), которая учитывает распределение несвязанных атомов в зависимости от типа атома и расстояния, и метод энергетической деформации (Майоров и Абагян, 1998), который использует различия от средних энергий остатков в различных средах для определения какие части белковой структуры могут быть проблематичными. Мело и Фейтманс (1998) используют парный атомный потенциал и потенциал сольватации на основе поверхности (оба основаны на знаниях) для оценки белковых структур. За исключением метода энергетической деформации, который представляет собой полуэмпирический подход, основанный на силовом поле ECEPP3 (Немети и др., 1992), все перечисленные выше локальные методы основаны на статистических потенциалах. Концептуально отличным подходом является метод ProQres, который совсем недавно был предложен Уолнером и Элофссоном (2006). ProQres основан на нейронной сети, которая объединяет структурные особенности, позволяющие отличать правильные области от неправильных. Было показано, что ProQres превосходит более ранние методологии, основанные на статистических подходах (Verify3D, ProsaII и Errat). Данные, представленные в исследовании Уолнера и Элофссона, показывают, что их подход к машинному обучению, основанный на структурных особенностях, действительно превосходит методы, основанные на статистике. Однако методы, основанные на знаниях, рассмотренные в их работах, Verify3D (Luthy et al. 1992; Eisenberg et al. 1997), Prosa (Sippl 1993) и Errat (Colovos and Yeates 1993), не основаны на новых статистических возможностях.

Бенчмаркинг

Было предпринято несколько крупномасштабных попыток сравнительного анализа для оценки относительного качества различных современных методов моделирования гомологии. CASP — это эксперимент по прогнозированию в масштабах всего сообщества, который проводится каждые два года в летние месяцы и требует от групп прогнозистов представить структурные модели для ряда последовательностей, структуры которых недавно были решены экспериментально, но еще не опубликованы. Ее партнер CAFASP работает параллельно с CASP, но оценивает только модели, созданные с помощью полностью автоматизированных серверов. Постоянно проводимые эксперименты, в которых нет прогнозируемых «сезонов», сосредоточены главным образом на сравнительном тестировании общедоступных веб-серверов. LiveBench и EVA работают непрерывно для оценки производительности участвующих серверов при прогнозировании скорого выпуска структур из PDB. CASP и CAFASP служат главным образом для оценки современного уровня моделирования, в то время как непрерывные оценки направлены на оценку качества модели, которое может быть получено пользователем, не являющимся экспертом, с использованием общедоступных инструментов.

Точность

Точность структур, полученных с помощью моделирования гомологии, сильно зависит от идентичности последовательностей между мишенью и матрицей. При идентичности последовательностей выше 50% модели, как правило, надежны, с незначительными ошибками в упаковке боковой цепи и ротамерном состоянии, а общее среднеквадратическое отклонение между смоделированной и экспериментальной структурой составляет около 1 Å . Эта ошибка сравнима с типичным разрешением структуры, решенной методом ЯМР. В диапазоне идентичности 30–50% ошибки могут быть более серьезными и часто располагаются в циклах. При идентичности ниже 30% возникают серьезные ошибки, иногда приводящие к неправильному прогнозированию базовой складки. ^[13] Эту область с низкой идентичностью часто называют «сумеречной зоной», в которой моделирование гомологии чрезвычайно затруднено и для которой оно, возможно, менее подходит, чем методы распознавания складок . ^[23]

При высокой идентичности последовательностей основным источником ошибок при моделировании гомологии является выбор матрицы или матриц, на которых основана модель, тогда как при более низкой идентичности возникают серьезные ошибки в выравнивании последовательностей, которые препятствуют созданию высококачественных моделей. ^[6] Было высказано предположение, что основным препятствием для создания качественных моделей являются недостатки в выравнивании последовательностей, поскольку «оптимальные» структурные выравнивания между двумя белками известной структуры могут использоваться в качестве входных данных для современных методов моделирования для получения довольно точных репродукций оригинала. экспериментальная структура. ^[24]

Были предприняты попытки повысить точность моделей гомологии, построенных с использованием существующих методов, подвергая их молекулярно-динамическому моделированию с целью улучшить их среднеквадратическое отклонение в соответствии с экспериментальной структурой. Однако текущие параметризации силового поля могут быть недостаточно точными для этой задачи, поскольку модели гомологии, используемые в качестве исходных структур для молекулярной динамики, имеют тенденцию создавать немного худшие структуры. ^[25] Незначительные улучшения наблюдались в тех случаях, когда во время моделирования использовались значительные ограничения. ^[26]

Источники ошибок

Двумя наиболее распространенными и крупномасштабными источниками ошибок при моделировании гомологии являются плохой выбор матрицы и неточности в выравнивании последовательностей целевой матрицы. ^[6]^[27] Контроль этих двух факторов с помощью структурного выравнивания или выравнивания последовательностей, полученного на основе сравнения двух решенных структур, значительно снижает ошибки в окончательных моделях; эти выравнивания «золотого стандарта» можно использовать в качестве входных данных для современных методов моделирования для получения довольно точного воспроизведения исходной экспериментальной структуры. ^[24] Результаты самого последнего эксперимента CASP показывают, что «консенсусные» методы, собирающие результаты многократного распознавания складок и поиска множественных выравниваний, повышают вероятность идентификации правильного шаблона; Аналогичным образом, использование нескольких шаблонов на этапе построения модели может быть хуже, чем использование одного правильного шаблона, но лучше, чем использование одного неоптимального. ^[27] Ошибки выравнивания можно свести к минимуму за счет использования множественного выравнивания, даже если используется только один шаблон, а также за счет итеративного уточнения локальных областей с низким сходством. ^[3]^[11] Меньшим источником ошибок модели являются ошибки в структуре шаблона. В базе данных PDBREPORT перечислено несколько миллионов, в основном очень мелких, но иногда и серьезных ошибок в экспериментальных (шаблонных) структурах, хранящихся в PDB .

Серьезные локальные ошибки могут возникнуть в моделях гомологии, где мутация вставки или делеции или пробел в решенной структуре приводят к образованию области целевой последовательности, для которой нет соответствующей матрицы. Эту проблему можно свести к минимуму за счет использования нескольких матриц, но метод усложняется из-за различных локальных структур матриц вокруг разрыва и из-за вероятности того, что недостающая область в одной экспериментальной структуре также отсутствует в других структурах того же семейства белков. . Отсутствующие области чаще всего встречаются в циклах , где высокая локальная гибкость увеличивает сложность определения региона методами определения структуры. Несмотря на то, что даже для одного шаблона некоторые рекомендации предоставляются путем расположения концов отсутствующей области, чем длиннее зазор, тем сложнее его моделировать. В некоторых случаях петли, содержащие примерно до 9 остатков, можно смоделировать с умеренной точностью, если локальное выравнивание правильное. ^[3] Более крупные регионы часто моделируются индивидуально с использованием методов предсказания структуры ab initio , хотя этот подход имел лишь единичный успех. ^[28]

Ротамерные состояния боковых цепей и их внутреннее расположение упаковки также представляют трудности при моделировании гомологии даже в мишенях, структуру основной цепи которых относительно легко предсказать. Частично это связано с тем, что многие боковые цепи в кристаллических структурах не находятся в своем «оптимальном» ротамерном состоянии из-за энергетических факторов в гидрофобном ядре и упаковки отдельных молекул в белковом кристалле. ^[29] Один из методов решения этой проблемы требует поиска ротамерной библиотеки для идентификации локально низкоэнергетических комбинаций состояний упаковки. ^[30] Было высказано предположение, что основная причина того, что моделирование гомологии так сложно, когда идентичность последовательности-мишени-матрицы составляет менее 30%, заключается в том, что такие белки имеют в целом схожие складки, но сильно расходящиеся механизмы упаковки боковых цепей. ^[4]

Полезность

Использование структурных моделей включает прогнозирование белок-белкового взаимодействия , стыковку белок-белок , молекулярную стыковку и функциональное аннотирование генов , идентифицированных в геноме организма . ^[31] Даже модели гомологии с низкой точностью могут быть полезны для этих целей, поскольку их неточности, как правило, локализуются в петлях на поверхности белка, которые обычно более вариабельны даже между близкородственными белками. Функциональные области белка, особенно его активный центр , имеют тенденцию быть более консервативными и, следовательно, более точно моделироваться. ^[13]

Модели гомологии также можно использовать для выявления тонких различий между родственными белками, которые не все структурно решены. Например, метод был использован для идентификации сайтов связывания катионов на Na ⁺ /K ⁺-АТФазе и для выдвижения гипотез об аффинности связывания различных АТФаз. ^[32] Используемые в сочетании с моделированием молекулярной динамики модели гомологии также могут генерировать гипотезы о кинетике и динамике белка, как, например, в исследованиях ионной селективности калиевого канала . ^{[33] Для}дрожжей Saccharomyces cerevisiae была предпринята попытка крупномасштабного автоматического моделирования всех идентифицированных кодирующих белок областей в геноме , в результате чего было создано около 1000 качественных моделей белков, структура которых еще не была определена на момент исследования, и выявление новых взаимоотношений между 236 дрожжевыми белками и другими ранее решенными структурами. ^[34]