Генная (или генетическая ) регуляторная сеть ( GRN ) представляет собой совокупность молекулярных регуляторов, которые взаимодействуют друг с другом и с другими веществами в клетке, управляя уровнями экспрессии генов мРНК и белков, которые, в свою очередь, определяют функцию клетки. . GRN также играет центральную роль в морфогенезе , создании структур тела, что, в свою очередь, играет центральную роль в эволюционной биологии развития (эво-дево).
Регулятором может быть ДНК , РНК , белок или любая комбинация двух или более из этих трех, образующих комплекс, например, специфическая последовательность ДНК и фактор транскрипции для активации этой последовательности. Взаимодействие может быть прямым или непрямым (через транскрибируемую РНК или транслируемый белок). В общем, каждая молекула мРНК образует определенный белок (или набор белков). В некоторых случаях этот белок будет структурным и будет накапливаться на клеточной мембране или внутри клетки, придавая ей определенные структурные свойства. В других случаях белок будет ферментом , то есть микромашиной, которая катализирует определенную реакцию, например расщепление источника пищи или токсина. Однако некоторые белки служат только для активации других генов, и именно эти факторы транскрипции играют главную роль в регуляторных сетях или каскадах. Связываясь с промоторной областью в начале других генов, они включают их, инициируя выработку другого белка и так далее. Некоторые факторы транскрипции являются ингибирующими. [1]
В одноклеточных организмах регуляторные сети реагируют на внешнюю среду, оптимизируя клетку в данный момент времени для выживания в этой среде. Таким образом, дрожжевая клетка, оказавшись в растворе сахара, активирует гены для выработки ферментов, перерабатывающих сахар в спирт. [2] Этот процесс, который мы связываем с виноделием, заключается в том, как дрожжевые клетки живут, получая энергию для размножения, что при нормальных обстоятельствах повышает ее шансы на выживание.
У многоклеточных животных тот же принцип используется в каскадах генов, контролирующих форму тела. [3] Каждый раз, когда клетка делится, образуются две клетки, которые, хотя и содержат один и тот же полный геном, могут различаться тем, какие гены включаются и производят белки. Иногда «самоподдерживающаяся петля обратной связи» гарантирует, что клетка сохраняет свою идентичность и передает ее дальше. Менее понятным является механизм эпигенетики , с помощью которого модификация хроматина может обеспечивать клеточную память, блокируя или разрешая транскрипцию. Главной особенностью многоклеточных животных является использование градиентов морфогена , которые, по сути, обеспечивают систему позиционирования, сообщающую клетке, в каком месте тела она находится и, следовательно, какой клеткой ей стать. Ген, включенный в одной клетке, может производить продукт, который покидает клетку и диффундирует через соседние клетки, проникая в них и активируя гены только тогда, когда его присутствие превышает определенный пороговый уровень. Таким образом, эти клетки приобретают новую судьбу и могут даже генерировать другие морфогены , которые передают сигнал исходной клетке. На больших расстояниях морфогены могут использовать активный процесс передачи сигнала . Такая передача сигналов контролирует эмбриогенез , построение плана тела с нуля посредством ряда последовательных шагов. Они также контролируют и поддерживают организм взрослого человека посредством процессов обратной связи , и потеря такой обратной связи из-за мутации может быть ответственна за пролиферацию клеток, наблюдаемую при раке . Параллельно с этим процессом построения структуры каскад генов включает гены, которые производят структурные белки , которые придают каждой клетке необходимые ей физические свойства.
На одном уровне биологические клетки можно рассматривать как «частично смешанные пакеты» биологических химических веществ – при обсуждении сетей регуляции генов этими химическими веществами в основном являются информационные РНК (мРНК) и белки , которые возникают в результате экспрессии генов. Эти мРНК и белки взаимодействуют друг с другом с различной степенью специфичности. Некоторые диффундируют по клетке. Другие связываются с клеточными мембранами , взаимодействуя с молекулами окружающей среды. Третьи проходят через клеточные мембраны и передают сигналы дальнего действия другим клеткам многоклеточного организма. Эти молекулы и их взаимодействия составляют сеть регуляции генов . Типичная сеть регуляции генов выглядит примерно так:
Узлы этой сети могут представлять собой гены, белки, мРНК, белково-белковые комплексы или клеточные процессы. Узлы, которые изображены лежащими вдоль вертикальных линий, связаны с интерфейсами ячейка/среда, тогда как остальные являются свободно плавающими и могут распространяться . Ребра между узлами представляют собой взаимодействия между узлами, которые могут соответствовать отдельным молекулярным реакциям между ДНК, мРНК, микроРНК, белками или молекулярным процессам, посредством которых продукты одного гена влияют на продукты другого, хотя отсутствие экспериментально полученной информации часто подразумевает, что некоторые реакции не моделируются на таком высоком уровне детализации. Эти взаимодействия могут быть индуктивными (обычно обозначаются стрелками или знаком +), с увеличением концентрации одного приводит к увеличению другого, тормозными (обозначаются закрашенными кружками, тупыми стрелками или знаком минус), с увеличением в одном приводящее к уменьшению другого, или двойственное, когда в зависимости от обстоятельств регулятор может активировать или затормозить целевой узел. Узлы могут регулировать себя прямо или косвенно, создавая петли обратной связи, которые образуют циклические цепочки зависимостей в топологической сети. Сетевая структура — это абстракция молекулярной или химической динамики системы, описывающая множество способов, которыми одно вещество влияет на все остальные, с которыми оно связано. На практике такие GRN выводятся из биологической литературы по данной системе и представляют собой квинтэссенцию коллективных знаний о наборе связанных биохимических реакций. Чтобы ускорить ручное управление GRN, некоторые недавние усилия пытаются использовать для этой цели интеллектуальный анализ текста , курируемые базы данных, сетевой вывод на основе массивных данных, проверку моделей и другие технологии извлечения информации. [4]
Гены можно рассматривать как узлы в сети, где входными данными являются белки, такие как факторы транскрипции , а выходными данными — уровень экспрессии генов . Значение узла зависит от функции, которая зависит от значения его регуляторов на предыдущих временных шагах (в описанной ниже булевой сети это логические функции , обычно И, ИЛИ и НЕ). Эти функции интерпретируются как своего рода обработка информации внутри клетки, которая определяет клеточное поведение. Основными движущими силами внутри клеток являются концентрации некоторых белков, которые определяют как пространственные (расположение внутри клетки или ткани), так и временные (клеточный цикл или стадия развития) координаты клетки, как своего рода «клеточная память». Генные сети только начинают понимать, и следующим шагом биологии будет попытка определить функции каждого генного «узла», чтобы помочь понять поведение системы на возрастающих уровнях сложности, от гена до сигнального пути. , клеточном или тканевом уровне. [5]
Математические модели GRN были разработаны для отражения поведения моделируемой системы и в некоторых случаях для генерации прогнозов, соответствующих экспериментальным наблюдениям. В некоторых других случаях оказалось, что модели дают точные новые предсказания, которые можно проверить экспериментально, предлагая тем самым новые подходы к исследованию в эксперименте, которые иногда не учитываются при разработке протокола экспериментальной лаборатории. Методы моделирования включают дифференциальные уравнения (ОДУ), логические сети, сети Петри , байесовские сети , графические сетевые модели Гаусса , стохастические вычисления и исчисления процессов . [6] И наоборот, были предложены методы создания моделей GRN, которые лучше всего объясняют набор наблюдений временных рядов . Недавно было показано, что сигнал модификации гистонов ChIP-seq в большей степени коррелирует с мотивами транскрипционных факторов на промоторах, чем с уровнем РНК. [7] Таким образом, предполагается, что модификация гистонов с помощью временных рядов ChIP-seq может обеспечить более надежный вывод о генно-регуляторных сетях по сравнению с методами, основанными на уровнях экспрессии.
Обычно считается, что сети генной регуляции состоят из нескольких узлов с высокой степенью связи ( концентраторов ) и множества узлов со слабой связью, вложенных в иерархический режим регуляции. Таким образом, сети регуляции генов приближаются к топологии свободной сети иерархического масштаба . [8] Это согласуется с мнением, что большинство генов обладают ограниченной плейотропией и действуют в рамках регуляторных модулей . [9] Считается, что эта структура развивается из-за преимущественного прикрепления дублированных генов к более тесно связанным генам. [8] Недавние исследования также показали, что естественный отбор имеет тенденцию отдавать предпочтение сетям с редкой связностью. [10]
В основном существует два пути развития сетей, оба из которых могут происходить одновременно. Во-первых, топология сети может быть изменена путем добавления или удаления узлов (генов) или части сети (модули) могут быть выражены в разных контекстах. Хорошим примером является сигнальный путь Drosophila Hippo . Сигнальный путь Hippo контролирует как митотический рост, так и постмитотическую клеточную дифференцировку. [11] Недавно было обнаружено, что сеть, в которой работает сигнальный путь Hippo, различается между этими двумя функциями, что, в свою очередь, меняет поведение сигнального пути Hippo. Это предполагает, что сигнальный путь Hippo действует как консервативный регуляторный модуль, который может использоваться для множества функций в зависимости от контекста. [11] Таким образом, изменение топологии сети может позволить консервативному модулю выполнять несколько функций и изменить конечный результат работы сети. Второй способ развития сетей — это изменение силы взаимодействий между узлами, например, насколько сильно транскрипционный фактор может связываться с цис-регуляторным элементом . Было показано, что такие различия в прочности краев сети лежат в основе межвидовых различий в паттерне судеб клеток вульвы червей Caenorhabditis . [12]
Другой широко цитируемой характеристикой регуляторной сети генов является обилие определенных повторяющихся подсетей, известных как сетевые мотивы . Сетевые мотивы можно рассматривать как повторяющиеся топологические закономерности при разделении большой сети на маленькие блоки. Предыдущий анализ обнаружил несколько типов мотивов, которые чаще появлялись в сетях генной регуляции, чем в случайно сгенерированных сетях. [13] [14] [15] Например, один из таких мотивов называется петлями прямой связи, которые состоят из трех узлов. Этот мотив является наиболее распространенным среди всех возможных мотивов, состоящих из трех узлов, как показано в регуляторных сетях генов мухи, нематоды и человека. [15]
Было предложено, чтобы обогащенные мотивы следовали конвергентной эволюции , предполагая, что они представляют собой «оптимальные конструкции» для определенных целей регулирования. [16] Например, моделирование показывает, что петли прямой связи способны координировать изменения в узле A (с точки зрения концентрации и активности) и динамику выражения узла C, создавая различное поведение ввода-вывода. [17] [18] Система утилизации галактозы E. coli содержит петлю прямого распространения, которая ускоряет активацию оперона утилизации галактозы galETK , потенциально облегчая метаболический переход к галактозе при истощении запасов глюкозы. [19] Петля прямой связи в системах утилизации арабинозы E.coli задерживает активацию оперона и транспортеров катаболизма арабинозы, потенциально избегая ненужного метаболического перехода из-за временных колебаний в вышестоящих сигнальных путях. [20] Аналогичным образом, в сигнальном пути Wnt у Xenopus петля прямой связи действует как детектор кратных изменений, который реагирует на кратные изменения, а не на абсолютное изменение уровня β-катенина, потенциально увеличивая устойчивость к колебания уровня β-катенина. [21] Согласно гипотезе конвергентной эволюции, обогащение контуров прямой связи будет адаптацией для быстрого реагирования и устойчивости к шуму. Недавнее исследование показало, что у дрожжей, выращенных в среде с постоянным уровнем глюкозы, развиваются мутации в сигнальных путях глюкозы и пути регуляции роста, что позволяет предположить, что регуляторные компоненты, реагирующие на изменения окружающей среды, необязательны в постоянной среде. [22]
С другой стороны, некоторые исследователи предполагают, что обогащение сетевых мотивов носит неадаптивный характер. [23] Другими словами, генные регуляторные сети могут эволюционировать до аналогичной структуры без специфического выбора предполагаемого поведения ввода-вывода. Подтверждение этой гипотезы часто приходит с помощью компьютерного моделирования. Например, колебания количества петель прямой связи в модели, которая моделирует эволюцию сетей генной регуляции путем случайного пересоединения узлов, могут свидетельствовать о том, что обогащение петель прямой связи является побочным эффектом эволюции. [24] В другой модели эволюции сетей генных регуляторов соотношение частот дупликации и делеции генов оказывает большое влияние на топологию сети: определенные соотношения приводят к обогащению петель прямой связи и создают сети, которые демонстрируют особенности иерархического масштаба. бесплатные сети. Эволюция de novo когерентных контуров прямой связи типа 1 была продемонстрирована вычислительно в ответ на выбор их гипотетической функции по фильтрации короткого паразитного сигнала, поддерживая адаптивную эволюцию, но для неидеализированного шума - основанную на динамике систему подачи- Вместо этого было отдано предпочтение прямому регулированию с другой топологией. [25]
Регуляторные сети позволяют бактериям адаптироваться практически к каждой экологической нише на Земле. [26] [27] Сеть взаимодействий между различными типами молекул, включая ДНК, РНК, белки и метаболиты, используется бактериями для регулирования экспрессии генов. У бактерий основная функция регуляторных сетей заключается в контроле реакции на изменения окружающей среды, например, на состояние питания и экологический стресс. [28] Сложная организация сетей позволяет микроорганизму координировать и интегрировать множество сигналов окружающей среды. [26]
Одним из примеров стресса является ситуация, когда окружающая среда внезапно становится бедной питательными веществами. Это запускает сложный процесс адаптации у бактерий , таких как кишечная палочка . После этого изменения окружающей среды тысячи генов меняют уровень экспрессии. Однако эти изменения предсказуемы исходя из топологии и логики генной сети [29] , о которой сообщается в RegulonDB . В частности, в среднем силу ответа гена можно было предсказать по разнице между количеством активирующих и репрессирующих входных факторов транскрипции этого гена. [29]
Обычно такую сеть моделируют с помощью набора связанных обыкновенных дифференциальных уравнений (ОДУ) или СДУ , описывающих кинетику реакции составных частей. Предположим, что наша регуляторная сеть имеет узлы, и пусть представляют собой концентрации соответствующих веществ во времени . Тогда временная эволюция системы может быть приближенно описана выражением
где функции выражают зависимость от концентрации других веществ, присутствующих в клетке. Функции в конечном итоге выводятся из основных принципов химической кинетики или простых выражений, полученных на их основе, например, ферментативной кинетики Михаэлиса-Ментена . Следовательно, функциональные формы обычно выбираются в виде полиномов низкого порядка или функций Хилла , которые служат анзацем для реальной молекулярной динамики. Такие модели затем изучаются с использованием математики нелинейной динамики . Специфическая для системы информация, такая как константы скорости реакции и чувствительность, кодируется как постоянные параметры. [30]
Решая для неподвижной точки системы:
для всех можно получить (возможно, несколько) профили концентрации белков и мРНК, которые теоретически устойчивы (хотя и не обязательно стабильны ). Таким образом, устойчивые состояния кинетических уравнений соответствуют потенциальным типам клеток, а осциллирующие решения приведенного выше уравнения — естественно циклическим типам клеток. Математическая устойчивость этих аттракторов обычно может характеризоваться знаком высших производных в критических точках и тогда соответствовать биохимической устойчивости концентрационного профиля. Критические точки и бифуркации в уравнениях соответствуют критическим состояниям клетки, в которых небольшие возмущения состояния или параметров могут переключить систему между одним из нескольких стабильных судеб дифференцировки. Траектории соответствуют развертыванию биологических путей, а переходные процессы уравнений — краткосрочным биологическим событиям. Более математическое обсуждение см. в статьях о нелинейности , динамических системах , теории бифуркаций и теории хаоса .
Следующий пример иллюстрирует, как булева сеть может моделировать GRN вместе с продуктами его генов (выходные данные) и веществами из окружающей среды, которые на него влияют (входные данные). Стюарт Кауфман был одним из первых биологов, использовавших метафору булевых сетей для моделирования генетических регуляторных сетей. [31] [32]
Валидность модели можно проверить путем сравнения результатов моделирования с наблюдениями временных рядов. Частичная проверка модели булевой сети также может быть получена путем проверки предсказанного существования еще неизвестной регуляторной связи между двумя конкретными факторами транскрипции, каждый из которых является узлами модели. [33]
Непрерывные сетевые модели GRN являются расширением описанных выше логических сетей. Узлы по-прежнему представляют собой гены и связи между ними, оказывающие регуляторное влияние на экспрессию генов. Гены в биологических системах демонстрируют непрерывный диапазон уровней активности, и утверждается, что использование непрерывного представления отражает некоторые свойства сетей регуляции генов, отсутствующие в булевой модели. [34] Формально большинство этих подходов похожи на искусственную нейронную сеть , поскольку входные данные узла суммируются, а результат служит входными данными для сигмовидной функции, например, [35] , но белки часто контролируют экспрессию генов синергетически. , то есть нелинейным, способом. [36] Однако в настоящее время существует модель непрерывной сети [37] , которая позволяет группировать входы в узел, реализуя, таким образом, другой уровень регулирования. Эта модель формально ближе к рекуррентной нейронной сети более высокого порядка . Та же модель также использовалась для имитации эволюции клеточной дифференцировки [38] и даже многоклеточного морфогенеза . [39]
Недавние экспериментальные результаты [40] [41] продемонстрировали, что экспрессия генов представляет собой стохастический процесс. Таким образом, многие авторы теперь используют стохастический формализм после работы Аркина и др. [42] Работы по экспрессии одиночного гена [43] и небольшим синтетическим генетическим сетям, [44] [45] таким как генетический тумблер Тима Гарднера и Джима Коллинза , предоставили дополнительные экспериментальные данные о фенотипической изменчивости и стохастической природе генов. выражение. Первые версии стохастических моделей экспрессии генов включали только мгновенные реакции и основывались на алгоритме Гиллеспи . [46]
Поскольку некоторые процессы, такие как транскрипция генов, включают в себя множество реакций и не могут быть правильно смоделированы как мгновенные реакции в один этап, было предложено моделировать эти реакции как одностадийные реакции с множественной задержкой, чтобы учесть время, необходимое для весь процесс должен быть завершен. [47]
Отсюда был предложен набор реакций [48] , позволяющих генерировать GRN. Затем они моделируются с использованием модифицированной версии алгоритма Гиллеспи, который может моделировать множественные реакции с задержкой по времени (химические реакции, в которых каждому из продуктов предоставляется временная задержка, определяющая, когда он будет выпущен в систему как «готовый продукт»). .
Например, базовую транскрипцию гена можно представить следующей одностадийной реакцией (РНКП — РНК-полимераза, RBS — сайт связывания РНК-рибосомы, а Pro i — промоторная область гена i ):
Более того, похоже, существует компромисс между шумом в экспрессии генов, скоростью, с которой гены могут переключаться, и метаболическими затратами, связанными с их функционированием. Точнее, для любого заданного уровня метаболических затрат существует оптимальный компромисс между шумом и скоростью обработки, а увеличение метаболических затрат приводит к лучшему компромиссу между скоростью и шумом. [49] [50] [51]
В недавней работе был предложен симулятор (SGNSim, Stochastic Gene Networks Simulator ) [52] , который может моделировать GRN, где транскрипция и трансляция моделируются как события с множественной задержкой во времени, а их динамика управляется алгоритмом стохастического моделирования (SSA), способным справляться с несколько событий с задержкой по времени. Временные задержки могут быть получены из нескольких распределений, а скорости реакции - из сложных функций или физических параметров. SGNSim может генерировать ансамбли GRN в рамках набора определяемых пользователем параметров, таких как топология. Его также можно использовать для моделирования конкретных GRN и систем химических реакций. Также можно моделировать генетические нарушения, такие как делеции генов, сверхэкспрессия генов, инсерции, мутации сдвига рамки считывания.
GRN создается из графа с желаемой топологией, налагающей распределения входящей и исходящей степени. На активность промотора гена влияют другие продукты экспрессии генов, которые действуют как входные данные в форме мономеров или объединены в мультимеры и установлены как прямые или непрямые. Затем каждый прямой входной сигнал назначается операторскому сайту, и различным факторам транскрипции можно разрешить или запретить конкурировать за один и тот же операторный сайт, в то время как косвенным входным сигналам присваивается цель. Наконец, каждому гену присваивается функция, определяющая реакцию гена на комбинацию факторов транскрипции (состояние промотора). Передаточные функции (то есть то, как гены реагируют на комбинацию входных сигналов) могут быть назначены каждой комбинации состояний промотора по желанию.
В других недавних работах были разработаны многомасштабные модели сетей генной регуляции, ориентированные на приложения синтетической биологии. Было использовано моделирование, которое моделирует все биомолекулярные взаимодействия при транскрипции, трансляции, регуляции и индукции генных регуляторных сетей, что определяет дизайн синтетических систем. [53]
Другая работа была сосредоточена на прогнозировании уровней экспрессии генов в сети регуляции генов. Подходы, используемые для моделирования сетей регуляции генов, были ограничены для интерпретации и, как следствие, обычно представляют собой упрощенные версии сети. Например, логические сети использовались из-за их простоты и способности обрабатывать зашумленные данные, но терять информацию данных из-за двоичного представления генов. Кроме того, искусственные нейронные сети не используют скрытый слой, чтобы их можно было интерпретировать, теряя способность моделировать корреляции более высокого порядка в данных. Используя модель, которая не ограничена интерпретацией, можно создать более точную модель. Возможность более точно прогнозировать экспрессию генов дает возможность изучить, как лекарства влияют на систему генов, а также определить, какие гены взаимосвязаны в этом процессе. Этому способствовал конкурс DREAM [54] , который продвигает конкурс на лучшие алгоритмы прогнозирования. [55] В некоторых других недавних работах использовались искусственные нейронные сети со скрытым слоем. [56]
Выделяют три класса рассеянного склероза: рецидивно-ремиттирующий (РРС), первично-прогрессирующий (ППРС) и вторично-прогрессирующий (ВПРС). Сеть регуляции генов (GRN) играет жизненно важную роль в понимании механизма заболевания в трех различных классах рассеянного склероза. [57]