Генетическое сцепление — это тенденция последовательностей ДНК , которые находятся близко друг к другу на хромосоме , наследоваться вместе во время фазы мейоза полового размножения . Два генетических маркера , которые физически находятся близко друг к другу, вряд ли будут разделены на разные хроматиды во время хромосомного кроссинговера , и поэтому говорят, что они более связаны, чем маркеры, которые находятся далеко друг от друга. Другими словами, чем ближе два гена находятся на хромосоме, тем ниже вероятность рекомбинации между ними и тем больше вероятность того, что они будут унаследованы вместе. Маркеры на разных хромосомах совершенно не связаны , хотя на пенетрантность потенциально вредных аллелей может влиять присутствие других аллелей, и эти другие аллели могут быть расположены на других хромосомах, чем та, на которой находится конкретный потенциально вредный аллель. [1]
Генетическая связь является наиболее заметным исключением из закона Грегора Менделя о независимом распределении . Первый эксперимент, демонстрирующий связь, был проведен в 1905 году. В то время причина, по которой определенные признаки имеют тенденцию наследоваться вместе, была неизвестна. Более поздние исследования показали, что гены являются физическими структурами, связанными физическим расстоянием.
Типичная единица генетического сцепления — сантиморган (cM). Расстояние в 1 cM между двумя маркерами означает, что маркеры разделяются на разные хромосомы в среднем один раз на 100 мейотических продуктов, то есть один раз на 50 мейозов.
Закон независимого распределения Грегора Менделя гласит , что каждый признак наследуется независимо от любого другого признака. Но вскоре после того, как работа Менделя была переоткрыта , были найдены исключения из этого правила. В 1905 году британские генетики Уильям Бейтсон , Эдит Ребекка Сондерс и Реджинальд Паннетт скрещивали растения гороха в экспериментах, похожих на эксперименты Менделя. [2] [3] Они интересовались наследованием признаков у душистого горошка и изучали два гена — ген окраски цветка ( P , фиолетовый, и p , красный) и ген, влияющий на форму пыльцевых зерен ( L , длинный, и l , круглый). Они скрестили чистые линии PPLL и ppll , а затем самоскрещивали полученные линии PpLl .
Согласно менделевской генетике , ожидаемые фенотипы будут происходить в соотношении 9:3:3:1 PL:Pl:pL:pl. К своему удивлению, они наблюдали повышенную частоту PL и pl и пониженную частоту Pl и pL:
Их эксперимент выявил связь между аллелями P и L и аллелями p и l . Частота появления P вместе с L и p вместе с l больше, чем у рекомбинантных Pl и pL . Частоту рекомбинации сложнее вычислить в скрещивании F2, чем в обратном скрещивании, [4], но отсутствие соответствия между наблюдаемым и ожидаемым числом потомства в приведенной выше таблице указывает на то, что она составляет менее 50%. Это указывает на то, что два фактора каким-то образом взаимодействовали, чтобы создать это различие, маскируя появление двух других фенотипов. Это привело к выводу, что некоторые признаки связаны друг с другом из-за их близкого расположения друг к другу на хромосоме.
Понимание сцепления было расширено работой Томаса Ханта Моргана . Наблюдение Моргана о том, что количество кроссинговеров между сцепленными генами различается, привело к идее, что частота кроссинговера может указывать на расстояние, разделяющее гены на хромосоме . Сантиморган , который выражает частоту кроссинговера, назван в его честь.
Карта сцепления (также известная как генетическая карта ) — это таблица для вида или экспериментальной популяции, которая показывает положение его известных генов или генетических маркеров относительно друг друга с точки зрения частоты рекомбинации, а не конкретного физического расстояния вдоль каждой хромосомы. Карты сцепления были впервые разработаны Альфредом Стертевантом , учеником Томаса Ханта Моргана .
Карта сцепления — это карта, основанная на частотах рекомбинации между маркерами во время кроссинговера гомологичных хромосом . Чем больше частота рекомбинации (сегрегации) между двумя генетическими маркерами, тем дальше они, как предполагается, находятся друг от друга. И наоборот, чем ниже частота рекомбинации между маркерами, тем меньше физическое расстояние между ними. Исторически изначально использовались маркеры, которые можно обнаружить по фенотипам (выработка ферментов, цвет глаз), полученным из кодирующих последовательностей ДНК ; в конечном итоге были использованы подтвержденные или предполагаемые некодирующие последовательности ДНК, такие как микросателлиты или те, которые генерируют полиморфизмы длины рестрикционных фрагментов ( ПДРФ ).
Карты сцепления помогают исследователям находить другие маркеры, такие как другие гены, путем тестирования на генетическое сцепление уже известных маркеров. На ранних стадиях разработки карты сцепления данные используются для сборки групп сцепления , набора генов, которые, как известно, связаны. По мере накопления знаний, в группу можно добавлять больше маркеров, пока группа не охватит всю хромосому. [6] Для хорошо изученных организмов группы сцепления соответствуют хромосомам один к одному.
Карта сцепления не является физической картой (например, картой гибридов с уменьшенным уровнем радиации ) или генной картой .
Анализ сцепления — это генетический метод, который ищет хромосомные сегменты, которые косегрегируют с фенотипом заболевания через семьи. [7] Его можно использовать для картирования генов как для бинарных, так и для количественных признаков. [7] Анализ сцепления может быть либо параметрическим (если мы знаем связь между фенотипическим и генетическим сходством), либо непараметрическим. Параметрический анализ сцепления — это традиционный подход, при котором вероятность того, что ген, важный для заболевания, связан с генетическим маркером, изучается с помощью оценки LOD, которая оценивает вероятность того, что данная родословная, где заболевание и маркер косегрегируют, обусловлена существованием сцепления (с заданным значением сцепления) или случайностью. Непараметрический анализ сцепления, в свою очередь, изучает вероятность того, что аллель является идентичным по происхождению с самим собой.
Оценка LOD (логарифм (по основанию 10) шансов), разработанная Ньютоном Мортоном [ 8], представляет собой статистический тест, часто используемый для анализа сцепления в популяциях людей, животных и растений. Оценка LOD сравнивает вероятность получения тестовых данных, если два локуса действительно связаны, с вероятностью наблюдения тех же данных чисто случайно. Положительные оценки LOD свидетельствуют о наличии сцепления, тогда как отрицательные оценки LOD указывают на то, что сцепление менее вероятно. Компьютерный анализ оценок LOD представляет собой простой способ анализа сложных семейных родословных с целью определения связи между менделевскими признаками (или между признаком и маркером, или двумя маркерами).
Метод более подробно описан Страханом и Ридом.[1] Вкратце, он работает следующим образом:
Оценка LOD рассчитывается следующим образом:
NR обозначает количество нерекомбинантных потомков, а R обозначает количество рекомбинантных потомков. Причина, по которой в знаменателе используется 0,5, заключается в том, что любые аллели, которые полностью не связаны (например, аллели на отдельных хромосомах), имеют 50% вероятность рекомбинации из-за независимого распределения. θ — рекомбинантная фракция, т. е. фракция рождений, в которых рекомбинация произошла между изучаемым генетическим маркером и предполагаемым геном, связанным с заболеванием. Таким образом, она равна R / ( NR + R ) .
По соглашению, оценка LOD выше 3,0 считается доказательством сцепления, поскольку она указывает на вероятность 1000 к 1, что наблюдаемая связь не произошла случайно. С другой стороны, оценка LOD ниже −2,0 считается доказательством исключения сцепления. Хотя маловероятно, что оценка LOD 3 будет получена из одной родословной, математические свойства теста позволяют объединять данные из нескольких родословных путем суммирования их оценок LOD. Оценка LOD 3 соответствует значению p приблизительно 0,05 [9] , и не требуется никакой коррекции множественного тестирования (например, поправки Бонферрони ). [10]
Анализ сцепления имеет ряд методологических и теоретических ограничений, которые могут значительно увеличить частоту ошибок первого типа и снизить возможности картирования локусов количественных признаков человека (QTL). [11] Хотя анализ сцепления успешно использовался для выявления генетических вариантов, способствующих редким расстройствам, таким как болезнь Хантингтона , он не показал таких хороших результатов при применении к более распространенным расстройствам, таким как болезни сердца или различные формы рака . [12] Объяснением этого является то, что генетические механизмы, влияющие на распространенные расстройства, отличаются от механизмов, вызывающих некоторые редкие расстройства. [13]
Частота рекомбинации является мерой генетического сцепления и используется при создании генетической карты сцепления. Частота рекомбинации ( θ ) — это частота, с которой будет происходить одиночный хромосомный кроссинговер между двумя генами во время мейоза . Сантиморган (cM) — это единица, которая описывает частоту рекомбинации в 1%. Таким образом, мы можем измерить генетическое расстояние между двумя локусами на основе их частоты рекомбинации. Это хорошая оценка реального расстояния. Двойные кроссинговеры превратились бы в отсутствие рекомбинации. В этом случае мы не можем сказать, имели ли место кроссинговеры. Если анализируемые нами локусы находятся очень близко (менее 7 cM), двойной кроссинговер очень маловероятен. Когда расстояния становятся больше, вероятность двойного кроссинговера увеличивается. По мере увеличения вероятности двойного кроссинговера можно систематически недооценивать генетическое расстояние между двумя локусами, если только не использовать соответствующую математическую модель.
Двойное сцепление — это скорее историческая проблема для растений. У животных двойной кроссинговер случается редко. Например, у людей одна хромосома имеет в среднем два кроссинговера во время мейоза. Более того, у современных генетиков достаточно генов, так что анализировать сцепление нужно только для соседних генов, в отличие от ранних дней, когда было известно всего несколько генов. [14]
Во время мейоза хромосомы случайным образом распределяются по гаметам , так что сегрегация аллелей одного гена не зависит от аллелей другого гена. Это указано во Втором законе Менделя и известно как закон независимого распределения . Закон независимого распределения всегда справедлив для генов, расположенных на разных хромосомах, но для генов, расположенных на одной хромосоме, он не всегда справедлив.
В качестве примера независимого сортирования рассмотрим скрещивание чистопородного гомозиготного родительского штамма с генотипом AABB с другим чистопородным штаммом с генотипом aabb . A и a и B и b представляют собой аллели генов A и B. Скрещивание этих гомозиготных родительских штаммов приведет к появлению потомства поколения F1, которое будет двойным гетерозиготным с генотипом AaBb. Потомство F1 AaBb производит гаметы AB , Ab , aB и ab с равными частотами (25%), поскольку аллели гена A сортируются независимо от аллелей гена B во время мейоза. Обратите внимание, что 2 из 4 гамет (50%) — Ab и aB — не присутствовали в родительском поколении. Эти гаметы представляют собой рекомбинантные гаметы . Рекомбинантные гаметы — это те гаметы, которые отличаются от обеих гаплоидных гамет, которые составляли исходную диплоидную клетку. В этом примере частота рекомбинации составляет 50%, поскольку 2 из 4 гамет были рекомбинантными гаметами.
Частота рекомбинации составит 50%, когда два гена расположены на разных хромосомах или когда они сильно разнесены на одной хромосоме. Это следствие независимого распределения.
Когда два гена находятся близко друг к другу на одной хромосоме, они не сортируются независимо и называются сцепленными. В то время как гены, расположенные на разных хромосомах, сортируются независимо и имеют частоту рекомбинации 50%, сцепленные гены имеют частоту рекомбинации менее 50%.
В качестве примера сцепления рассмотрим классический эксперимент Уильяма Бейтсона и Реджинальда Паннета . [15] Они интересовались наследованием признаков у душистого горошка и изучали два гена — ген окраски цветка ( P , фиолетовый, и p , красный) и ген, влияющий на форму пыльцевых зерен ( L , длинный, и l , круглый). Они скрестили чистые линии PPLL и ppll, а затем самоскрещивали полученные линии PpLl . Согласно менделевской генетике , ожидаемые фенотипы будут возникать в соотношении 9:3:3:1 PL:Pl:pL:pl. К своему удивлению, они наблюдали повышенную частоту PL и pl и пониженную частоту Pl и pL (см. таблицу ниже).
Их эксперимент выявил связь между аллелями P и L и аллелями p и l . Частота появления P вместе с L и p вместе с l больше, чем у рекомбинантных Pl и pL . Частоту рекомбинации сложнее вычислить в скрещивании F2, чем в обратном скрещивании [4], но отсутствие соответствия между наблюдаемым и ожидаемым числом потомков в приведенной выше таблице указывает на то, что она составляет менее 50%.
Потомство в этом случае получило два доминантных аллеля, сцепленных на одной хромосоме (называемых сцеплением или цис-расположением ). Однако после кроссинговера некоторое потомство могло получить одну родительскую хромосому с доминантным аллелем для одного признака (например, Purple), сцепленным с рецессивным аллелем для второго признака (например, round), с противоположным для другой родительской хромосомы (например, red и Long). Это называется отталкиванием или транс-расположением . Фенотип здесь все еще будет фиолетовым и длинным, но тестовое скрещивание этой особи с рецессивным родителем даст потомство с гораздо большей долей двух кроссоверных фенотипов. Хотя такая проблема может показаться маловероятной из этого примера, неблагоприятные связи отталкивания действительно возникают при селекции на устойчивость к болезням у некоторых культур.
Два возможных расположения аллелей в двойной гетерозиготе (цис и транс) называются гаметическими фазами , а фазирование — это процесс определения того, какое из двух присутствует у данной особи.
Когда два гена расположены на одной хромосоме, вероятность кроссинговера , производящего рекомбинацию между генами, связана с расстоянием между двумя генами. Таким образом, использование частот рекомбинации использовалось для разработки карт сцепления или генетических карт .
Однако важно отметить, что частота рекомбинации имеет тенденцию недооценивать расстояние между двумя связанными генами. Это происходит потому, что, поскольку два гена расположены дальше друг от друга, вероятность двойного или четного числа кроссоверов между ними также увеличивается. Двойное или четное число кроссоверов между двумя генами приводит к их косегрегации в одну и ту же гамету, что дает родительское потомство вместо ожидаемого рекомбинантного потомства. Как упоминалось выше, преобразования Косамби и Холдейна пытаются исправить множественные кроссоверы. [16]
В начале 1950-х годов преобладающим мнением было то, что гены в хромосоме являются дискретными сущностями, неделимыми генетической рекомбинацией и расположенными как бусины на нитке. В течение 1955-1959 годов Бензер проводил эксперименты по генетической рекомбинации с использованием мутантов rII бактериофага T4 . Он обнаружил, что на основе тестов на рекомбинацию сайты мутации можно картировать в линейном порядке. [17] [18] Этот результат предоставил доказательства ключевой идеи о том, что ген имеет линейную структуру, эквивалентную длине ДНК со многими сайтами, которые могут независимо мутировать.
Эдгар и др. [19] провели эксперименты по картированию с мутантами r бактериофага T4, показав, что частоты рекомбинации между мутантами rII не являются строго аддитивными. Частота рекомбинации от скрещивания двух мутантов rII (axd) обычно меньше суммы частот рекомбинации для соседних внутренних подинтервалов (axb) + (bxc) + (cxd). Хотя и не строго аддитивная, была обнаружена систематическая связь [20] , которая, вероятно, отражает лежащий в основе молекулярный механизм генетической рекомбинации .
Хотя рекомбинация хромосом является важным процессом во время мейоза, существует большой диапазон частоты кроссинговеров между организмами и внутри видов. Сексуально диморфные скорости рекомбинации называются гетерохиазмией и наблюдаются чаще, чем общая скорость между самцами и самками. У млекопитающих самки часто имеют более высокую скорость рекомбинации по сравнению с самцами. Предполагается, что существуют уникальные отборы, действующие или мейотические драйверы, которые влияют на разницу в скоростях. Разница в скоростях может также отражать совершенно разные среды и условия мейоза в оогенезе и сперматогенезе. [21]
Мутации в генах , кодирующих белки, участвующие в обработке ДНК, часто влияют на частоту рекомбинации . В бактериофаге T4 мутации, которые снижают экспрессию репликативной ДНК-полимеразы [продукт гена 43 (gp43)], увеличивают рекомбинацию (уменьшают сцепление) в несколько раз. [22] [23] Увеличение рекомбинации может быть вызвано ошибками репликации дефектной ДНК-полимеразой, которые сами по себе являются событиями рекомбинации, такими как переключение шаблонов, т. е. событиями рекомбинации с выбором копии. [24] Рекомбинация также увеличивается мутациями, которые снижают экспрессию ДНК-лигазы (gp30) [25] [23] и dCMP-гидроксиметилазы (gp42), [22] [23] двух ферментов, используемых в синтезе ДНК .
Рекомбинация снижается (сцепление увеличивается) за счет мутаций в генах, кодирующих белки с функциями нуклеазы (gp46 и gp47) [25] [23] и ДНК-связывающий белок (gp32) [23]. Мутация в гене бактериофага uvsX также существенно снижает рекомбинацию. [26] Ген uvsX аналогичен хорошо изученному гену recA Escherichia coli , который играет центральную роль в рекомбинации. [27]
При очень больших родословных или при очень плотных данных генетических маркеров, таких как секвенирование всего генома, можно точно локализовать рекомбинации. При этом типе генетического анализа индикатор мейоза назначается каждой позиции генома для каждого мейоза в родословной. Индикатор указывает, какая копия родительской хромосомы вносит вклад в переданную гамету в этой позиции. Например, если передается аллель из «первой» копии родительской хромосомы, этому мейозу может быть назначен «0». Если передается аллель из «второй» копии родительской хромосомы, этому мейозу будет назначен «1». Два аллеля в родителе пришли, по одному от двух бабушек и дедушек. Затем эти индикаторы используются для определения состояний идентичности по происхождению (IBD) или состояний наследования, которые, в свою очередь, используются для идентификации генов, ответственных за заболевания.