Компонент комплемента 4 ( C4 ) у людей — это белок, участвующий в сложной системе комплемента , происходящей из системы человеческого лейкоцитарного антигена (HLA). Он выполняет ряд критических функций в иммунитете, толерантности и аутоиммунитете вместе с другими многочисленными компонентами. Кроме того, он является решающим фактором в соединении путей распознавания всей системы, инициированных комплексами антитело-антиген (Ab-Ag), с другими эффекторными белками врожденного иммунного ответа. Например, тяжесть дисфункциональной системы комплемента может привести к смертельным заболеваниям и инфекциям. Сложные ее вариации также могут привести к шизофрении . [1] Считалось, что белок C4 произошел от простой двухлокусной аллельной модели, которая, однако, была заменена гораздо более сложной многомодульной моделью комплекса генов RCCX , которая содержит длинные и короткие формы генов C4A или C4B , обычно в тандемных кассетах RCCX с вариацией числа копий, что в некоторой степени соответствует вариации уровней их соответствующих белков в популяции вместе с CYP21 в некоторых случаях в зависимости от количества кассет и того, содержит ли он функциональный ген вместо псевдогенов или фрагментов. [2] Первоначально определенная в контексте системы групп крови Чидо/Роджерса, генетическая модель C4A-C4B исследуется на предмет ее возможной роли в риске и развитии шизофрении .
Одно из ранних генетических исследований белка C4 выявило две различные группы, обнаруженные в сыворотке крови человека, называемые группами крови Chido/Rogers (Ch/Rg). О'Нил и др. продемонстрировали, что два различных локуса C4 экспрессируют различные антигены Ch/Rg на мембранах эритроцитов. [3] Более конкретно, два белка, Ch и Rg, функционируют вместе как среда для взаимодействия между комплексом Ab-Ag и другими компонентами комплемента. [4] Более того, два локуса связаны с HLA или человеческим аналогом главного комплекса гистосовместимости (MHC) на коротком плече хромосомы 6, тогда как ранее считалось, что они экспрессируются двумя кодоминантными аллелями в одном локусе. [3] [5] В исследованиях с помощью гель-электрофореза О'Нил и др. идентифицировали два генетических варианта: F, означающий наличие (F+) или отсутствие (f0/ f0) четырех быстро движущихся полос, и S, означающий наличие (S+) или отсутствие (s0/ s0) четырех медленно движущихся полос. [3] Однородность или неоднородность двух локусов с добавлением этих нулевых (f0, s0) генов допускает дупликацию/недупликацию локусов C4. [6] Таким образом, наличие отдельных локусов для C4, C4F и C4S (позднее идентифицированных как C4A или C4B, соответственно), возможно, объясняет создание множественных аллельных форм, что приводит к большой вариации размера и числа копий . [ требуется ссылка ]
Два важных исследователя, Кэрролл и Портер, в своем исследовании клонирования человеческого гена C4 показали, что все шесть их клонов содержали один и тот же ген C4. [7] Белок C4 состоит из 3 субъединиц (α, β и γ) с молекулярными массами (ММ) ~95 000, 78 000 и 31 000 соответственно, и все они соединены межцепочечными дисульфидными мостиками. [7] [8] [9] [10] В исследовании Рооса и др. было обнаружено, что α-цепи между C4A и C4B немного отличаются (ММ ~96 000 и 94 000 соответственно), что доказывает, что на самом деле существует структурное различие между двумя вариантами. [9] Более того, они предположили, что отсутствие активности C4 может быть связано со структурными различиями между α-цепями. [9] Тем не менее, Кэрролл и Портер продемонстрировали, что существует область размером 1500 п.н., которая действует как интрон в геномной последовательности, которая, как они полагали, является известной областью C4d, побочным продуктом активности C4. [7] Кэрролл и др. позже опубликовали работу, в которой охарактеризовали структуру и организацию генов C4, которые расположены в области HLA класса III и связаны с C2 и фактором B на хромосоме. [11] С помощью экспериментов, включающих рестрикционное картирование, анализ нуклеотидной последовательности и гибридизацию с C4A и C4B, они обнаружили, что гены на самом деле довольно похожи, хотя у них есть свои различия. [11] Например, были обнаружены полиморфизмы отдельных нуклеотидов, что позволило им быть классовыми различиями между C4A и C4B. [11] Кроме того, классовые и аллельные различия будут влиять на производительность белков C4 с иммунным комплексом. [11] Наконец, путем перекрытия клонированных фрагментов кДНК они смогли определить, что локусы C4, предполагаемая длина которых составляет 16 килобаз (кб), разнесены на 10 кб и выровнены на 30 кб от локуса фактора B. [10] [11]
В том же году исследования, связанные с этим, идентифицировали 98 кб области хромосомы, где четыре гена класса III (которые экспрессируют C4A, C4B, C2 и фактор B) тесно связаны, что не позволяет происходить кроссинговерам. [10] Используя варианты белков, визуализированные с помощью электрофореза, четыре структурных гена были расположены между HLA-B и HLA-D. [10] Более конкретно, они проверили предложенную молекулярную карту, на которой порядок генов шел от фактора B , C4B, C4A и C2, причем C2 был ближе всего к HLA-B. [10] В другом исследовании Лоу и др. затем продолжили углубляться, на этот раз сравнивая свойства как C4A, так и C4B, оба из которых играют существенную роль в системе иммунитета человека. [12] С помощью методов, которые включают инкубацию, различные уровни pH и обработку метиламином, они биохимически проиллюстрировали различную реактивность генов C4. [12] Более конкретно, C4B показал себя гораздо более эффективным и действенным, несмотря на разницу в 7 кб между C4A и C4B. В цельной сыворотке аллели C4B действовали со скоростью, в несколько раз большей во время гемолитической активности, по сравнению с аллелями C4A. [12] Биохимически они также обнаружили, что C4A более устойчиво реагировал с боковыми цепями аминокислот антитела и антигенами, которые являются аминогруппами, в то время как C4B лучше реагировал с гидроксильными группами углеводов. [12] Таким образом, после анализа различных реактивностей они предположили, что исключительный полиморфизм генов C4 может приводить к некоторым биологическим преимуществам (т. е. активации комплемента с более широким диапазоном комплексов Ab-Ag, образующихся при инфекциях). [12] Хотя на тот момент времени геномная и производная аминокислотная последовательность C4A или C4B еще не были определены. [ необходима цитата ]
Ранние исследования значительно расширили знания о комплексе C4, заложив основы, которые проложили путь к открытию структур генов и белков. C. Yu успешно определил полную последовательность гена компонента комплемента человека C4A. [4] В результате было обнаружено, что весь геном имеет 41 экзон с общим количеством остатков 1744 (несмотря на то, что избегали последовательности большого интрона 9). [4] Белок C4 синтезируется в виде одноцепочечного предшественника, который затем подвергается протеолитическому расщеплению на три цепи (в порядке их соединения в цепочку, β-α-γ). [4]
β-цепь состоит из 656 остатков, кодируемых экзонами 1-16. [4] Наиболее заметным аспектом β-цепи является наличие большого интрона, размером от шести до семи килобаз. [4] Он присутствует в первом локусе (кодирующем C4A) для всех генов C4 и во втором локусе (кодирующем C4B) только в нескольких генах C4. [4] α-цепь состоит из остатков 661-1428, кодирующих экзоны 16-33. [4] Внутри этой цепи два сайта расщепления, отмеченные экзонами 23 и 30, производят фрагмент C4d (где расположены тиоэфир, антигены Ch/Rg и изотипические остатки); более того, большинство полиморфных сайтов кластеризуются в этой области. [4] γ-цепь состоит из 291 остатка, кодирующих экзоны 33-41. [4] К сожалению, γ-цепи не приписана никакая конкретная функция. [4]
Исследование, завершенное Вайшнау и др., было направлено на выявление ключевой области и факторов, связанных с усилиями экспрессии гена C4. [13] Их исследование пришло к выводу, что сайт связывания Sp1 (расположенный в диапазоне от -59 до -49) играет важную роль в точном запуске базальной транскрипции C4. [13] Использование анализов сдвига электромобильности и анализов отпечатков ДНКазы I продемонстрировало специфические ДНК-белковые корреляции промотора C4 в ядерном факторе 1, двух E-box (от -98 до -93 и от -78 до -73) и доменах связывания Sp1. [13] Эти результаты были позже добавлены в другом обширном исследовании, в котором был обнаружен третий сайт E-box. [14] Кроме того, те же результаты постулируют, что две физические сущности в последовательности гена могут играть роль в уровнях экспрессии человеческих C4A и C4B, включая как присутствие эндогенного ретровируса, который может оказывать положительное или отрицательное регуляторное влияние на транскрипцию C4, так и изменяющуюся генетическую среду (в зависимости от того, какой генетический модульный компонент присутствует) после позиции -1524. [14]
Чтобы обеспечить больше контекста, в последнем исследовании ранее отмеченная бимодулярная структура (C4A-C4B) была обновлена до четырехмодулярной структуры из одного-четырех дискретных сегментов, содержащих один или несколько модулей RP-C4-CYP21-TNX ( RCCX ). [2] Размер гена C4A или C4B может составлять 21 кб (длинный, L) или 14,6 кб (короткий, S). Кроме того, длинный ген C4 уникально содержит ретровирус HERV-K(C4) в своем интроне 9, который навязывает транскрипцию дополнительных 6,36 кб, отсюда и «более длинная» строка гена. [2] [14] Таким образом, гены C4 имеют сложную картину вариаций в размере гена, числе копий и полиморфизме. [2] [14] Примеры этих моно-, би-, три- и квадримодулярных структур включают: L или S (мономодулярный с одним длинным или коротким геном C4), LL или LS или SS (бимодулярный с комбинацией гомозиготных или гетерозиготных генов L или S), LLL или LLS или LSS (тримодулярный RCCX с тремя генами L или S C4), LLLL (квадримодулярная структура с четырьмя генами L или S C4). [14] Не все структурные группы имеют одинаковый процент внешнего вида, возможно, даже дополнительные различия внутри отдельных этнических групп. Например, изученная популяция европеоидной расы показала 69% бимодулярной конфигурации (C4A-C4B, C4A-C4A или C4B-C4B) и 31% тримодулярной конфигурации (поровну разделенной между LLL как C4A-C4A-C4B или LSS как C4A-C4B-C4B). [14] Что касается полиморфизма последовательности белка C4, то было обнаружено в общей сложности 24 полиморфных остатка. Среди них β-цепь экспрессировала пять, в то время как α-цепь и γ-цепь производили 18 и один, соответственно. Эти полиморфизмы можно далее разделить на группы: 1) четыре изотипических остатка в определенных положениях, 2) антигенные детерминанты Ch/Rg в определенных положениях, 3) сайты связывания C5, 4) частные аллельные остатки. [14]
Кроме того, то же исследование выявило экспрессию транскриптов человеческого комплемента C4 в нескольких тканях. Результаты анализа Нозерн-блоттинга с использованием зонда C4d и зонда RD в качестве положительного контроля показали, что печень содержит большую часть транскриптов по всему телу. [14] Тем не менее, умеренные количества были выражены в корковом веществе/мозговом веществе надпочечников, щитовидной железе и почках. [14]
Как уже отмечалось, C4 (смесь C4A и C4B) участвует во всех трех путях комплемента (классическом, альтернативном и лектиновом); альтернативный путь «запускается спонтанно», в то время как классический и лектиновый пути вызываются в ответ на распознавание определенных микробов. [16] Все три пути сходятся на этапе, на котором белок комплемента C3 расщепляется на белки C3a и C3b, что приводит к литическому пути и образованию макромолекулярной сборки из множества белков, называемой мембраноатакующим комплексом (MAC), который служит порой в мембране целевого патогена, что приводит к разрушению вторгающейся клетки и в конечном итоге к лизису. [16]
В классическом пути компонент комплемента (далее сокращенно обозначаемый буквой «С» перед номером белка), называемый C1s, сериновая протеаза , активируется на предыдущих этапах пути, что приводит к расщеплению нативного, родительского белка C4 массой ~200 килодальтон (кДа), состоящего из трех цепей. [16] : 288 C4 расщепляется протеазой на две части: пептид C4a (небольшой, около ~9 кДа, и анафилотоксичный ) и белок с более высокой молекулярной массой C4b, массой около 190 кДа. [17] Расщепление C4 приводит к образованию C4b, несущего тиоэфирную функциональную группу [-SC(O)-]: работа 1980-х годов по C3, а затем по C4, указала на присутствие в родительских структурах C3 и C4 уникальной белковой модификации, 15-атомного (15-членного) тионолактонового кольца, служащего для соединения тиоловой боковой цепи аминокислоты цистеина (Cys) в последовательности -Cys-Gly-Glu-Glx- с ацильной группой боковой цепи того, что начиналось как боковая цепь глутамина (здесь Glx), которая располагалась тремя аминокислотными остатками ниже (где оставшиеся атомы из 15 были атомами основной и боковой цепи); [17] [18] при расщеплении эта уникальная структура тионолактонового кольца становится открытой на поверхности нового белка C4b. [16] [17] [18] Из-за близости к микробной поверхности некоторая часть высвобождаемых белков C4b с этим реактивным тионолактоном реагирует с нуклеофильными боковыми цепями аминокислот и другими группами на поверхности клетки чужеродного микроба, что приводит к ковалентному прикреплению слегка модифицированного белка C4b к поверхности клетки через исходный остаток Glx C4. [16] [17] [18]
C4b имеет дополнительные функции. Он взаимодействует с белком C2; та же протеаза, вызванная ранее, C1s, затем расщепляет C2 на две части, называемые C2a и C2b, при этом C2b высвобождается, а C2a остается в ассоциации с C4b; комплекс C4b-C2a двух белков затем проявляет дополнительную системно-ассоциированную протеазную активность по отношению к белку C3 (расщепляя его), с последующим высвобождением обоих белков, C4b и C2a, из их комплекса (после чего C4b может связывать другой белок C2 и снова проводить эти шаги). [16] Поскольку C4b регенерируется и создается цикл, комплекс C4b-C2a с протеазной активностью был назван конвертазой C3. [16] Белок 4b может быть далее расщеплен на 4c и 4d. [19]
Хотя другие заболевания (например, системная красная волчанка ) были вовлечены, ген C4 также изучается на предмет его возможной роли в риске и развитии шизофрении. В исследовании Wu et al. они использовали полимеразную цепную реакцию в реальном времени (RT-PCR) в качестве анализа для определения дисперсии числа копий (CNV) или генетического разнообразия C4. [20] Соответственно, с этими результатами будущие прогнозы, вспышки и ремиссии станут более осуществимыми для определения. Результаты в основном показывают вариации числа копий как механизм влияния на генетическое разнообразие. Как обсуждалось ранее, различные фенотипы, допускаемые различным генетическим разнообразием комплемента C4, включают широкий спектр белков C4 плазмы или сыворотки среди двух изотипов — C4A и C4B — с несколькими аллотипами белка, которые могут иметь уникальные физиологические функции. [20] CNV являются источниками врожденного генетического разнообразия и участвуют во взаимодействии генов и окружающей среды. [20] CNV (и связанные с ними полиморфизмы) играют роль в заполнении пробела в понимании генетической основы количественных признаков и различной восприимчивости к аутоиммунным и нейробиологическим заболеваниям. [ необходима ссылка ]
Были собраны и проанализированы значительные данные со всего мира, чтобы определить, что шизофрения действительно имеет сильную генетическую связь с регионом в локусе MHC на плече хромосомы 6. [21] [1]
Данные и информация, собранные на международном уровне, могут пролить свет на тайны шизофрении . Секар и др. проанализировали однонуклеотидные полиморфизмы (SNP) 40 когорт в 22 странах, что в общей сложности составило около 29 000 случаев. [1] Они обнаружили две особенности: 1) Большое количество SNP, достигающих всего 2 Мб на конце, 2) пик ассоциации, сосредоточенный в C4, что предсказывает, что уровни экспрессии C4A наиболее сильно коррелируют с шизофренией. [1] Кроме того, они обнаружили механизм, с помощью которого шизофрения может возникать из-за генетической предрасположенности человеческого комплемента C4. [1] Как показано на рисунке 1, четыре общих структурных вариации , обнаруженные в исследованиях ассоциаций по всему геному (GWAS), указали на высокую явку шизофрении. [1] Возможно, более высокие уровни экспрессии белка C4 из-за особенностей гена C4 приводят к нежелательному увеличению синаптической обрезки (эффект, производимый эффекторными белками системы комплемента , в которой участвует C4).