Изоформа белка , или « вариант белка », [1] является членом набора очень похожих белков , которые происходят из одного гена и являются результатом генетических различий. [2] Хотя многие из них выполняют одинаковые или похожие биологические роли, некоторые изоформы имеют уникальные функции. Набор изоформ белка может быть образован из альтернативных сплайсингов , использования переменного промотора или других посттранскрипционных модификаций одного гена; посттрансляционные модификации, как правило, не рассматриваются. (Для этого см. Протеоформы .) Благодаря механизмам сплайсинга РНК , мРНК имеет возможность выбирать различные кодирующие белок сегменты ( экзоны ) гена или даже различные части экзонов из РНК для формирования различных последовательностей мРНК. Каждая уникальная последовательность производит определенную форму белка.
Открытие изоформ может объяснить несоответствие между небольшим числом областей кодирования белков генов, выявленных в ходе проекта генома человека , и большим разнообразием белков, обнаруженных в организме: различные белки, кодируемые одним и тем же геном, могут увеличить разнообразие протеома . Изоформы на уровне РНК легко характеризуются с помощью исследований транскриптов кДНК . Многие человеческие гены обладают подтвержденными альтернативными изоформами сплайсинга. Было подсчитано, что у людей можно идентифицировать ~100 000 экспрессируемых последовательностей тегов ( EST ). [1] Изоформы на уровне белков могут проявляться в делеции целых доменов или более коротких петель, обычно расположенных на поверхности белка. [3]
Один ген обладает способностью производить несколько белков, которые различаются как по структуре, так и по составу; [4] [5] этот процесс регулируется альтернативным сплайсингом мРНК, хотя неясно, в какой степени такой процесс влияет на разнообразие человеческого протеома, поскольку обилие изоформ транскрипта мРНК не обязательно коррелирует с обилием изоформ белка. [6] Сравнение трехмерной структуры белка может быть использовано для определения того, какие изоформы, если таковые имеются, представляют собой функциональные белковые продукты, а структура большинства изоформ в человеческом протеоме была предсказана AlphaFold и опубликована на isoform.io. [7] Специфичность транслируемых изоформ выводится из структуры/функции белка, а также из типа клетки и стадии развития, на которой они производятся. [4] [5] Определение специфичности становится более сложным, когда белок имеет несколько субъединиц, и каждая субъединица имеет несколько изоформ.
Например, 5'-AMP-активируемая протеинкиназа (AMPK), фермент, который выполняет различные функции в клетках человека, имеет 3 субъединицы: [8]
В скелетных мышцах человека предпочтительная форма — α2β2γ1. [8] Но в печени человека наиболее распространенной формой является α1β2γ1. [8]
Основными механизмами, которые производят изоформы белка, являются альтернативный сплайсинг и использование вариабельного промотора, хотя модификации, вызванные генетическими изменениями, такими как мутации и полиморфизмы, иногда также считаются отдельными изоформами. [9]
Альтернативный сплайсинг — это основной процесс посттранскрипционной модификации , который производит изоформы транскрипта мРНК, и является основным молекулярным механизмом, который может способствовать разнообразию белков. [5] Сплайсосома , большой рибонуклеопротеин , — это молекулярная машина внутри ядра, отвечающая за расщепление и лигирование РНК , удаляющая некодирующие белки сегменты ( интроны ). [10]
Поскольку сплайсинг — это процесс, происходящий между транскрипцией и трансляцией , его основные эффекты в основном изучались с помощью методов геномики , например, микрочиповый анализ и секвенирование РНК использовались для идентификации альтернативно сплайсированных транскриптов и измерения их распространенности. [9] Распространенность транскрипта часто используется в качестве прокси для распространенности изоформ белка, хотя эксперименты по протеомике с использованием гель-электрофореза и масс-спектрометрии продемонстрировали, что корреляция между количеством транскрипта и белка часто низкая, и что одна изоформа белка обычно является доминирующей. [11] В одном исследовании 2015 года утверждается, что причина этого несоответствия, вероятно, возникает после трансляции, хотя механизм по существу неизвестен. [12] Следовательно, хотя альтернативный сплайсинг был замешан в качестве важной связи между вариацией и болезнью, нет убедительных доказательств того, что он действует в первую очередь путем производства новых изоформ белка. [11]
Альтернативный сплайсинг обычно описывает жестко регулируемый процесс, в котором альтернативные транскрипты намеренно генерируются аппаратом сплайсинга. Однако такие транскрипты также производятся ошибками сплайсинга в процессе, называемом «шумным сплайсингом», и также потенциально транслируются в изоформы белка. Хотя ~95% многоэкзонных генов считаются альтернативно сплайсированными, одно исследование шумного сплайсинга обнаружило, что большинство различных малораспространенных транскриптов являются шумовыми, и предсказывает, что большинство альтернативных транскриптов и изоформ белка, присутствующих в клетке, не являются функционально значимыми. [13]
Другие транскрипционные и посттранскрипционные регуляторные этапы также могут производить различные изоформы белка. [14] Использование переменного промотора происходит, когда транскрипционный аппарат клетки ( РНК-полимераза , факторы транскрипции и другие ферменты ) начинает транскрипцию на разных промоторах — области ДНК около гена, которая служит начальным сайтом связывания, — что приводит к слегка измененным транскриптам и изоформам белка.
Как правило, одна изоформа белка помечается как каноническая последовательность на основе таких критериев, как ее распространенность и сходство с ортологичными — или функционально аналогичными — последовательностями у других видов. [15] Предполагается, что изоформы имеют схожие функциональные свойства, поскольку большинство из них имеют схожие последовательности и разделяют некоторые или большинство экзонов с канонической последовательностью. Однако некоторые изоформы демонстрируют гораздо большую дивергенцию (например, посредством транссплайсинга ) и могут разделять мало или вообще не разделять экзонов с канонической последовательностью. Кроме того, они могут иметь разные биологические эффекты — например, в крайнем случае функция одной изоформы может способствовать выживанию клеток, в то время как другая способствует гибели клеток — или могут иметь схожие основные функции, но отличаться по своей субклеточной локализации. [16] Однако исследование 2016 года функционально охарактеризовало все изоформы 1492 генов и определило, что большинство изоформ ведут себя как «функциональные аллоформы». Авторы пришли к выводу, что изоформы ведут себя как отдельные белки, после того, как заметили, что функционал большинства изоформ не перекрывается. [17] Поскольку исследование проводилось на клетках in vitro , неизвестно, разделяют ли изоформы в экспрессированном человеческом протеоме эти характеристики. Кроме того, поскольку функция каждой изоформы, как правило, должна определяться отдельно, большинство идентифицированных и предсказанных изоформ все еще имеют неизвестные функции.
Гликоформа — это изоформа белка, которая отличается только количеством или типом прикрепленного гликана . Гликопротеины часто состоят из ряда различных гликоформ с изменениями в прикрепленном сахариде или олигосахариде . Эти модификации могут быть результатом различий в биосинтезе в процессе гликозилирования или из-за действия гликозидаз или гликозилтрансфераз . Гликоформы могут быть обнаружены с помощью детального химического анализа разделенных гликоформ, но более удобно обнаруживать с помощью дифференциальной реакции с лектинами , как в лектиновой аффинной хроматографии и лектиновой аффинной электрофорезе . Типичными примерами гликопротеинов, состоящих из гликоформ, являются белки крови, такие как орозомукоид , антитрипсин и гаптоглобин . Необычная вариация гликоформ наблюдается в молекуле адгезии нейрональных клеток, NCAM, включающей полисиаловые кислоты, PSA .
Моноаминоксидаза , семейство ферментов, катализирующих окисление моноаминов, существует в двух изоформах: МАО-А и МАО-В.