В молекулярной биологии внутренне неупорядоченный белок ( IDP ) — это белок , у которого отсутствует фиксированная или упорядоченная трехмерная структура , [2] [3] [4] как правило, при отсутствии его макромолекулярных партнеров по взаимодействию, таких как другие белки или РНК . IDP варьируются от полностью неструктурированных до частично структурированных и включают случайные спирали , расплавленные глобулы -подобные агрегаты или гибкие линкеры в крупных многодоменных белках . Иногда их рассматривают как отдельный класс белков наряду с глобулярными , фибриллярными и мембранными белками . [5]
IDP являются очень большим и функционально важным классом белков, и их открытие опровергло идею о том, что трехмерные структуры белков должны быть фиксированными для выполнения их биологических функций . Например, было идентифицировано, что IDP участвуют в слабых многовалентных взаимодействиях, которые являются высококооперативными и динамичными, что придает им важность в регуляции ДНК и в клеточной сигнализации . [6] [7] Многие IDP также могут принимать фиксированную трехмерную структуру после связывания с другими макромолекулами. В целом, IDP во многом отличаются от структурированных белков и, как правило, имеют отличительную функцию, структуру, последовательность , взаимодействия, эволюцию и регуляцию. [8]
В 1930-1950-х годах первые структуры белков были решены с помощью кристаллографии белков . Эти ранние структуры предполагали, что фиксированная трехмерная структура может быть, как правило, необходима для опосредования биологических функций белков. Эти публикации укрепили центральную догму молекулярной биологии в том, что аминокислотная последовательность белка определяет его структуру, которая, в свою очередь, определяет его функцию. В 1950 году Каруш написал о «конфигурационной адаптивности», противоречащей этому предположению. Он был убежден, что белки имеют более одной конфигурации на одном и том же энергетическом уровне и могут выбирать одну при связывании с другими субстратами. В 1960-х годах парадокс Левинталя предполагал, что систематический конформационный поиск длинного полипептида вряд ли даст единственную сложенную структуру белка в биологически значимых временных масштабах (т. е. от микросекунд до минут). Любопытно, что для многих (небольших) белков или доменов белков относительно быстрая и эффективная рефолдинг может наблюдаться in vitro. Как указано в «Догме» Анфинсена 1973 года, фиксированная трехмерная структура этих белков однозначно закодирована в их первичной структуре (аминокислотной последовательности), кинетически доступна и стабильна в диапазоне (близких) физиологических условий и, следовательно, может рассматриваться как нативное состояние таких «упорядоченных» белков. [10]
Однако в последующие десятилетия многие крупные белковые регионы не могли быть назначены в рентгеновских наборах данных, что указывает на то, что они занимают несколько позиций, которые усредняются в картах электронной плотности . Отсутствие фиксированных, уникальных позиций относительно кристаллической решетки предполагает, что эти регионы были «неупорядоченными». Спектроскопия ядерного магнитного резонанса белков также продемонстрировала наличие крупных гибких линкеров и концов во многих решенных структурных ансамблях.
В 2001 году Данкер задался вопросом, игнорировалась ли недавно обнаруженная информация в течение 50 лет [11], поскольку в 2000-х годах стали доступны более количественные анализы. [12] В 2010-х годах стало ясно, что ВРБ распространены среди белков, связанных с заболеваниями, таких как альфа-синуклеин и тау . [13]
В настоящее время общепризнано, что белки существуют как ансамбль схожих структур, в котором некоторые регионы более ограничены, чем другие. IDP занимают крайний конец этого спектра гибкости и включают белки со значительной локальной структурной тенденцией или гибкими многодоменными сборками. [14] [15]
Внутренний беспорядок особенно повышен среди белков, которые регулируют хроматин и транскрипцию, [16] и биоинформатические прогнозы указывают, что он более распространен в геномах и протеомах , чем в известных структурах в базе данных белков . На основе прогноза DISOPRED2 длинные (>30 остатков) неупорядоченные сегменты встречаются в 2,0% архейных, 4,2% эубактериальных и 33,0% эукариотических белков, [12] включая некоторые белки, связанные с заболеваниями. [13]
Высокодинамичные неупорядоченные области белков связаны с функционально важными явлениями, такими как аллостерическая регуляция и ферментативный катализ . [14] [15] Многие неупорядоченные белки имеют связывающее сродство со своими рецепторами, регулируемое посттрансляционной модификацией , поэтому было высказано предположение, что гибкость неупорядоченных белков облегчает различные конформационные требования для связывания модифицирующих ферментов, а также их рецепторов. [17] Внутренний беспорядок особенно богат белками, участвующими в клеточной сигнализации и транскрипции, [16] а также в функциях ремоделирования хроматина . [18] [19] Гены, которые недавно родились de novo, как правило, имеют более высокий беспорядок. [20] [21] У животных гены с высоким беспорядком теряются с большей скоростью в ходе эволюции. [22]
Неупорядоченные области часто встречаются в виде гибких линкеров или петель, соединяющих домены. Последовательности линкеров сильно различаются по длине, но обычно богаты полярными незаряженными аминокислотами . Гибкие линкеры позволяют связывающим доменам свободно скручиваться и вращаться, чтобы привлекать своих партнеров по связыванию посредством динамики доменов белка . Они также позволяют своим партнерам по связыванию вызывать более масштабные конформационные изменения посредством аллостерии на больших расстояниях . [14] [2] Гибкий линкер FBP25, который соединяет два домена FKBP25, важен для связывания FKBP25 с ДНК. [23]
Линейные мотивы представляют собой короткие неупорядоченные сегменты белков, которые опосредуют функциональные взаимодействия с другими белками или другими биомолекулами (РНК, ДНК, сахара и т. д.). [16] Многие роли линейных мотивов связаны с регуляцией клеток, например, с контролем формы клеток, субклеточной локализацией отдельных белков и регулируемым оборотом белков. Часто посттрансляционные модификации, такие как фосфорилирование, настраивают сродство (не редко на несколько порядков) отдельных линейных мотивов для специфических взаимодействий. Относительно быстрая эволюция и относительно небольшое количество структурных ограничений для установления новых (низкоаффинных) интерфейсов делают обнаружение линейных мотивов особенно сложным, но их широко распространенные биологические роли и тот факт, что многие вирусы имитируют/захватывают линейные мотивы для эффективной перекодировки инфицированных клеток, подчеркивают своевременную срочность исследований по этой очень сложной и захватывающей теме.
В отличие от глобулярных белков, IDP не имеют пространственно расположенных активных карманов. Удивительно, но 80% не связанных с мишенью IDP (~4 десятка), подвергнутых детальной структурной характеристике с помощью ЯМР, обладают линейными мотивами, называемыми PresMos (предварительно структурированные мотивы) [24] , которые являются временными вторичными структурными элементами, подготовленными для распознавания мишени. В нескольких случаях было показано, что эти временные структуры становятся полными и стабильными вторичными структурами, например, спиралями, при связывании с мишенью. Следовательно, PresMos являются предполагаемыми активными сайтами в IDP.
Многие неструктурированные белки претерпевают переходы в более упорядоченные состояния при связывании со своими мишенями (например, молекулярными распознающими признаками (MoRFs) [25] ). Связанное сворачивание и связывание могут быть локальными, вовлекая только несколько взаимодействующих остатков, или могут вовлекать целый домен белка. Недавно было показано, что связанное сворачивание и связывание позволяют захоронить большую площадь поверхности, что было бы возможно только для полностью структурированных белков, если бы они были намного больше. [26] Более того, некоторые неупорядоченные области могут служить «молекулярными переключателями» в регулировании определенной биологической функции путем переключения в упорядоченную конформацию при молекулярном распознавании, таком как связывание малых молекул, связывание ДНК/РНК, ионные взаимодействия и т. д. [27]
Способность неупорядоченных белков связываться и, таким образом, выполнять функцию, показывает, что стабильность не является обязательным условием. Многие короткие функциональные сайты, например, короткие линейные мотивы, чрезмерно представлены в неупорядоченных белках. Неупорядоченные белки и короткие линейные мотивы особенно распространены во многих РНК-вирусах, таких как вирус Хендра , вирус гепатита С , ВИЧ-1 и вирусы папилломы человека . Это позволяет таким вирусам преодолевать свои информационно ограниченные геномы, облегчая связывание и манипуляцию большим количеством белков клеток-хозяев . [28] [29]
Внутренне неупорядоченные белки могут сохранять свою конформационную свободу, даже когда они специфически связываются с другими белками. Структурный беспорядок в связанном состоянии может быть статическим или динамическим. В нечетких комплексах структурная множественность необходима для функционирования, а манипуляция связанной неупорядоченной областью изменяет активность. Конформационный ансамбль комплекса модулируется посредством посттрансляционных модификаций или белковых взаимодействий. [30] Специфичность ДНК-связывающих белков часто зависит от длины нечетких областей, которая варьируется путем альтернативного сплайсинга. [31] Некоторые нечеткие комплексы могут демонстрировать высокую связывающую аффинность, [32] хотя другие исследования показали разные значения аффинности для той же системы в разных режимах концентрации. [33]
Внутренне неупорядоченные белки адаптируют множество различных структур in vivo в соответствии с условиями клетки, создавая структурный или конформационный ансамбль. [34] [35]
Поэтому их структуры тесно связаны с функциями. Однако только несколько белков полностью неупорядочены в своем нативном состоянии. Беспорядок в основном обнаруживается в внутренне неупорядоченных областях (IDR) внутри в остальном хорошо структурированного белка. Поэтому термин внутренне неупорядоченный белок (IDP) включает белки, которые содержат IDR, а также полностью неупорядоченные белки.
Существование и тип беспорядка белка закодированы в его аминокислотной последовательности. [2] В целом, IDP характеризуются низким содержанием объемных гидрофобных аминокислот и высокой долей полярных и заряженных аминокислот, что обычно называют низкой гидрофобностью. [34] Это свойство приводит к хорошему взаимодействию с водой. Кроме того, высокие чистые заряды способствуют беспорядку из-за электростатического отталкивания, возникающего из-за одинаково заряженных остатков. [35] Таким образом, неупорядоченные последовательности не могут в достаточной степени скрыть гидрофобное ядро, чтобы свернуть его в стабильные глобулярные белки. В некоторых случаях гидрофобные кластеры в неупорядоченных последовательностях дают подсказки для идентификации областей, которые подвергаются сопряженному сворачиванию и связыванию (относятся к биологическим ролям). Многие неупорядоченные белки обнаруживают области без какой-либо регулярной вторичной структуры. Эти области можно назвать гибкими по сравнению со структурированными петлями. В то время как последние являются жесткими и содержат только один набор углов Рамачандрана, IDP включают несколько наборов углов. [35] Термин гибкость также используется для хорошо структурированных белков, но описывает другое явление в контексте неупорядоченных белков. Гибкость в структурированных белках связана с равновесным состоянием, тогда как в IDP это не так. [35] Многие неупорядоченные белки также показывают последовательности низкой сложности , то есть последовательности с избыточным представительством нескольких остатков . В то время как последовательности низкой сложности являются сильным признаком беспорядка, обратное не обязательно верно, то есть не все неупорядоченные белки имеют последовательности низкой сложности. Неупорядоченные белки имеют низкое содержание предсказанной вторичной структуры .
Из-за неупорядоченной природы этих белков были разработаны топологические подходы для поиска конформационных паттернов в их динамике. Например, топология цепей была применена для отслеживания динамики неупорядоченных доменов белков. [36] Используя топологический подход, можно классифицировать мотивы в соответствии с их топологическим построением и временной шкалой их формирования.
IDP могут быть проверены в нескольких контекстах. Большинство подходов к экспериментальной проверке IDP ограничиваются извлеченными или очищенными белками, в то время как некоторые новые экспериментальные стратегии направлены на изучение in vivo конформаций и структурных вариаций IDP внутри неповрежденных живых клеток и систематических сравнений между их динамикой in vivo и in vitro .
Первое прямое доказательство сохранения внутреннего расстройства in vivo было получено с помощью внутриклеточного ЯМР при электропорации очищенного IDP и восстановлении клеток до неповрежденного состояния. [37]
Теперь возможна более масштабная in vivo проверка прогнозов IDR с использованием «окрашивания» биотином. [38] [39]
Внутренне развернутые белки, будучи очищенными, могут быть идентифицированы различными экспериментальными методами. Основным методом получения информации о неупорядоченных областях белка является ЯМР-спектроскопия . Отсутствие электронной плотности в рентгеновских кристаллографических исследованиях также может быть признаком беспорядка.
Свернутые белки имеют высокую плотность (частичный удельный объем 0,72-0,74 мл/г) и соразмерно малый радиус инерции . Следовательно, развернутые белки могут быть обнаружены методами, которые чувствительны к размеру молекулы, плотности или гидродинамическому сопротивлению , такими как гель-хроматография , аналитическое ультрацентрифугирование , малоугловое рентгеновское рассеяние (SAXS) и измерения константы диффузии . Развернутые белки также характеризуются отсутствием вторичной структуры , что оценивается с помощью кругового дихроизма в дальнем УФ-диапазоне (170-250 нм) (особенно выраженного минимума при ~200 нм) или инфракрасной спектроскопии. Развернутые белки также имеют открытые пептидные группы основной цепи, открытые для растворителя, так что они легко расщепляются протеазами , подвергаются быстрому обмену водорода и дейтерия и демонстрируют небольшую дисперсию (<1 ppm) в их химических сдвигах амида 1H , измеренных с помощью ЯМР . (Свернутые белки обычно показывают дисперсию до 5 ppm для амидных протонов.) Недавно были введены новые методы, включая быстрый параллельный протеолиз (FASTpp) , которые позволяют определять фракцию свернутой/разупорядоченной без необходимости очистки. [40] [41] Даже тонкие различия в стабильности миссенс-мутаций, связывании партнера белка и (само)полимеризационной фальцовке (например) спиральных спиралей можно обнаружить с помощью FASTpp, как недавно было продемонстрировано с использованием взаимодействия белков тропомиозин-тропонин. [42] Полностью неструктурированные области белка можно экспериментально подтвердить по их гиперчувствительности к протеолизу с использованием короткого времени переваривания и низких концентраций протеазы. [43]
Массовые методы изучения структуры и динамики IDP включают SAXS для получения информации о форме ансамбля, ЯМР для уточнения атомистического ансамбля, флуоресценцию для визуализации молекулярных взаимодействий и конформационных переходов, рентгеновскую кристаллографию для выделения более подвижных областей в жестких кристаллах белков, крио-ЭМ для выявления менее фиксированных частей белков, рассеяние света для мониторинга распределения размеров IDP или кинетики их агрегации, химический сдвиг ЯМР и круговой дихроизм для мониторинга вторичной структуры IDP.
Методы изучения отдельных молекул для исследования IDP включают spFRET [44] для изучения конформационной гибкости IDP и кинетики структурных переходов, оптический пинцет [45] для высокоточного анализа ансамблей IDP и их олигомеров или агрегатов, нанопоры [46] для выявления глобальных распределений формы IDP, магнитный пинцет [47] для изучения структурных переходов в течение длительного времени при малых силах, высокоскоростную АСМ [48] для непосредственной визуализации пространственно-временной гибкости IDP.
Внутреннее расстройство может быть либо аннотировано из экспериментальной информации, либо предсказано с помощью специализированного программного обеспечения. Алгоритмы прогнозирования расстройств могут предсказывать склонность к внутреннему расстройству (ID) с высокой точностью (приближающейся к 80%) на основе первичного состава последовательности, сходства с нераспределенными сегментами в наборах данных рентгеновского анализа белков, гибких областей в исследованиях ЯМР и физико-химических свойств аминокислот.
Были созданы базы данных для аннотирования последовательностей белков с внутренней информацией о беспорядке. База данных DisProt содержит коллекцию вручную отобранных сегментов белков, которые были экспериментально определены как неупорядоченные. MobiDB — это база данных, объединяющая экспериментально отобранные аннотации беспорядка (например, из DisProt) с данными, полученными из отсутствующих остатков в рентгеновских кристаллографических структурах и гибких областей в структурах ЯМР.
Разделение неупорядоченных и упорядоченных белков необходимо для прогнозирования беспорядка. Одним из первых шагов для поиска фактора, отличающего IDP от не-IDP, является указание смещений в составе аминокислот. Следующие гидрофильные заряженные аминокислоты A, R, G, Q, S, P, E и K были охарактеризованы как аминокислоты, способствующие беспорядку, в то время как аминокислоты, способствующие порядку, W, C, F, I, Y, V, L и N являются гидрофобными и незаряженными. Остальные аминокислоты H, M, T и D неоднозначны, встречаются как в упорядоченных, так и в неструктурированных областях. [2] Более поздний анализ ранжировал аминокислоты по их склонности образовывать неупорядоченные области следующим образом (от порядка, способствующего возникновению, к беспорядку, способствующему возникновению): W, F, Y, I, M, L, V, N, C, T, A, G, R, D, H, Q, K, S, E, P. [49] Как видно из списка, небольшие заряженные гидрофильные остатки часто способствуют беспорядку, тогда как большие и гидрофобные остатки способствуют порядку.
Эта информация является основой большинства предикторов на основе последовательностей. Регионы с незначительной вторичной структурой или без нее, также известные как регионы NORS (NO Regular Secondary Structure), [50] и регионы с низкой сложностью могут быть легко обнаружены. Однако не все неупорядоченные белки содержат такие низкосложные последовательности.
Определение неупорядоченных областей с помощью биохимических методов является очень дорогостоящим и трудоемким. Из-за изменчивой природы IDP можно обнаружить только определенные аспекты их структуры, поэтому для полной характеристики требуется большое количество различных методов и экспериментов. Это еще больше увеличивает стоимость определения IDP. Чтобы преодолеть это препятствие, создаются компьютерные методы для прогнозирования структуры и функции белка. Одной из основных целей биоинформатики является получение знаний путем прогнозирования. Предикторы для функции IDP также разрабатываются, но в основном используют структурную информацию, такую как сайты линейных мотивов. [4] [51] Существуют различные подходы к прогнозированию структуры IDP, такие как нейронные сети или матричные вычисления, основанные на различных структурных и/или биофизических свойствах.
Многие вычислительные методы используют информацию о последовательности для прогнозирования того, является ли белок неупорядоченным. [52] Известные примеры такого программного обеспечения включают IUPRED и Disopred. Различные методы могут использовать разные определения беспорядка. Мета-предикторы показывают новую концепцию, объединяющую различные первичные предикторы для создания более компетентного и точного предиктора.
Из-за разных подходов к прогнозированию неупорядоченных белков оценка их относительной точности довольно сложна. Например, нейронные сети часто обучаются на разных наборах данных. Категория прогнозирования беспорядка является частью двухгодичного эксперимента CASP , который предназначен для проверки методов на точность поиска областей с отсутствующей трехмерной структурой (отмеченных в файлах PDB как REMARK465, отсутствующие электронные плотности в рентгеновских структурах).
Внутренне неструктурированные белки были вовлечены в ряд заболеваний. [13] Агрегация неправильно свернутых белков является причиной многих синуклеинопатий и токсичности, поскольку эти белки начинают связываться друг с другом случайным образом и могут привести к раку или сердечно-сосудистым заболеваниям. Таким образом, неправильное сворачивание может происходить спонтанно, поскольку в течение жизни организма производятся миллионы копий белков. Считается, что за это отвечает агрегация внутренне неструктурированного белка α-синуклеина . Структурная гибкость этого белка вместе с его восприимчивостью к модификации в клетке приводит к неправильному сворачиванию и агрегации. Генетика, окислительный и нитративный стресс, а также митохондриальные нарушения влияют на структурную гибкость неструктурированного белка α-синуклеина и связанные с этим механизмы заболеваний. [53] Многие ключевые супрессоры опухолей имеют большие внутренне неструктурированные области, например p53 и BRCA1. Эти области белков отвечают за опосредование многих их взаимодействий. Взяв за образец естественные защитные механизмы клетки, можно разработать лекарства, пытаясь заблокировать место вредных субстратов и подавить их, и таким образом противодействовать заболеванию. [54]
Из-за высокой структурной гетерогенности полученные экспериментальные параметры ЯМР/МУРР будут средним значением для большого числа весьма разнообразных и неупорядоченных состояний (ансамбль неупорядоченных состояний). Следовательно, для понимания структурных последствий этих экспериментальных параметров необходимо точное представление этих ансамблей с помощью компьютерного моделирования. Для этой цели можно использовать полноатомное молекулярно-динамическое моделирование, но его использование ограничено точностью текущих силовых полей при представлении неупорядоченных белков. Тем не менее, некоторые силовые поля были специально разработаны для изучения неупорядоченных белков путем оптимизации параметров силового поля с использованием доступных данных ЯМР для неупорядоченных белков. (примерами являются CHARMM 22*, CHARMM 32, [56] Amber ff03* и т. д.)
Моделирование МД, ограниченное экспериментальными параметрами (ограниченное МД), также использовалось для характеристики неупорядоченных белков. [57] [58] [59] В принципе, можно сделать выборку всего конформационного пространства, если моделирование МД (с точным силовым полем) выполняется достаточно долго. Из-за очень высокой структурной гетерогенности временные масштабы, которые необходимо запустить для этой цели, очень велики и ограничены вычислительной мощностью. Однако другие вычислительные методы, такие как ускоренное моделирование МД, [60] моделирование обмена репликами , [61]
[62] метадинамика , [63] [64] мультиканоническое моделирование МД [65] или методы, использующие крупнозернистое представление с неявными и явными растворителями [66] [67] [68], использовались для выборки более широкого конформационного пространства в меньших временных масштабах.
Более того, для понимания функциональных сегментов IDP использовались различные протоколы и методы анализа IDP, такие как исследования, основанные на количественном анализе содержания GC в генах и их соответствующих хромосомных полосах. [69] [70]