В молекулярной биологии и биоинформатике консенсусная последовательность (или каноническая последовательность ) — это рассчитанная последовательность наиболее частых остатков, нуклеотидов или аминокислот , найденных в каждой позиции в выравнивании последовательностей . Она представляет собой результаты множественных выравниваний последовательностей , в которых родственные последовательности сравниваются друг с другом и вычисляются схожие мотивы последовательностей . Такая информация важна при рассмотрении ферментов, зависящих от последовательности, таких как РНК-полимераза . [1]
Сайт связывания белка, представленный консенсусной последовательностью, может быть короткой последовательностью нуклеотидов , которая встречается в геноме несколько раз и, как полагают, играет одну и ту же роль в разных местах. Например, многие факторы транскрипции распознают определенные паттерны в промоторах генов , которые они регулируют. Таким же образом, рестриктазы обычно имеют палиндромные консенсусные последовательности, обычно соответствующие сайту, где они разрезают ДНК. Транспозоны действуют примерно таким же образом при идентификации целевых последовательностей для транспозиции. Наконец, сайты сплайсинга (последовательности, непосредственно окружающие границы экзон - интрон ) также можно рассматривать как консенсусные последовательности.
Таким образом, консенсусная последовательность является моделью для предполагаемого сайта связывания ДНК : она получается путем выравнивания всех известных примеров определенного сайта распознавания и определяется как идеализированная последовательность, которая представляет собой преобладающее основание в каждой позиции. Все фактические примеры не должны отличаться от консенсуса более чем на несколько замен, но подсчет несовпадений таким образом может привести к несоответствиям. [2]
Любая мутация, позволяющая мутированному нуклеотиду в основной последовательности промотора выглядеть более похожим на консенсусную последовательность, известна как мутация повышения . Этот тип мутации, как правило, делает промотор сильнее, и, таким образом, РНК-полимераза образует более тесную связь с ДНК, которую она хочет транскрибировать, и транскрипция регулируется повышенным образом. Напротив, мутации, которые разрушают консервативные нуклеотиды в консенсусной последовательности, известны как мутации понижения . Эти типы мутаций снижают транскрипцию, поскольку РНК-полимераза больше не может связываться так же прочно с основной последовательностью промотора.
Разработка программного обеспечения для распознавания образов является одной из основных тем в генетике , молекулярной биологии и биоинформатике . Конкретные мотивы последовательностей могут функционировать как регуляторные последовательности, контролирующие биосинтез, или как сигнальные последовательности , направляющие молекулу в определенное место внутри клетки или регулирующие ее созревание. Поскольку регуляторная функция этих последовательностей важна, считается, что они сохраняются в течение длительных периодов эволюции . В некоторых случаях эволюционное родство можно оценить по количеству консервации этих сайтов.
Консервативные мотивы последовательности называются консенсусными последовательностями и показывают, какие остатки являются консервативными, а какие — вариабельными. Рассмотрим следующий пример последовательности ДНК :
В этой нотации A означает, что A всегда находится в этой позиции; [CT] обозначает либо C, либо T; N обозначает любое основание; и {A} означает любое основание, кроме A. Y обозначает любой пиримидин , а R обозначает любой пурин . В этом примере нотация [CT] не дает никаких указаний на относительную частоту C или T, встречающихся в этой позиции. И ее невозможно записать как единую консенсусную последовательность, например ACNCCA. Альтернативный метод представления консенсусной последовательности использует логотип последовательности . Это графическое представление консенсусной последовательности, в котором размер символа связан с частотой, с которой данный нуклеотид (или аминокислота) встречается в определенной позиции. В логотипах последовательностей чем более консервативен остаток, тем больше символ для этого остатка; чем реже, тем меньше символ. Логотипы последовательностей можно создавать с помощью WebLogo или с помощью Gestalt Workbench, общедоступного инструмента визуализации, написанного Густаво Глусманом в Институте системной биологии. [2]
Инструменты биоинформатики способны вычислять и визуализировать консенсусные последовательности. Примерами инструментов являются JalView и UGENE .