stringtranslate.com

Геномный проект

В напечатанном виде последовательность генома человека занимает около 100 огромных книг, напечатанных мелким шрифтом.

Геномные проекты — это научные усилия, целью которых в конечном итоге является определение полной последовательности генома организма (будь то животное , растение , гриб , бактерия , архей , протист или вирус ) и аннотирование генов , кодирующих белки , и других важные функции, закодированные в геноме. [1] Последовательность генома организма включает коллективные последовательности ДНК каждой хромосомы в организме. Для бактерии, содержащей одну хромосому, проект генома будет направлен на картирование последовательности этой хромосомы. Для человеческого вида, геном которого включает 22 пары аутосом и 2 половые хромосомы, полная последовательность генома будет включать 46 отдельных последовательностей хромосом.

Проект «Геном человека» является хорошо известным примером проекта генома. [2]

Сборка генома

Сборка генома — это процесс взятия большого количества коротких последовательностей ДНК и их повторной сборки для создания представления об исходных хромосомах , из которых произошла ДНК. В проекте секвенирования методом дробовика вся ДНК из источника (обычно одного организма , от бактерии до млекопитающего ) сначала разбивается на миллионы мелких кусочков. Эти фрагменты затем «читаются» автоматическими секвенаторами. Алгоритм сборки генома работает, беря все части и выравнивая их друг с другом, а также обнаруживая все места, где две короткие последовательности или чтения перекрываются. Эти перекрывающиеся чтения можно объединить, и процесс продолжится.

Сборка генома — очень сложная вычислительная задача, которая усложняется тем, что многие геномы содержат большое количество идентичных последовательностей, известных как повторы . Эти повторы могут иметь длину в тысячи нуклеотидов и встречаться в разных местах, особенно в больших геномах растений и животных .

Результирующая (черновая) последовательность генома создается путем объединения секвенированных информационных контигов и последующего использования связывающей информации для создания каркасов. Каркасы расположены вдоль физической карты хромосом, создавая «золотой путь».

Программное обеспечение для сборки

Первоначально большинство крупных центров секвенирования ДНК разработали собственное программное обеспечение для сборки получаемых ими последовательностей. Однако ситуация изменилась по мере усложнения программного обеспечения и увеличения количества центров секвенирования. Пример такого ассемблера «Короткий пакет анализа олигонуклеотидов» , разработанный BGI для сборки de novo геномов человеческого размера, выравнивания, обнаружения SNP , повторного секвенирования, обнаружения инделей и анализа структурных вариаций. [3] [4] [5]

Аннотация генома

С 1980-х годов молекулярная биология и биоинформатика создали потребность в аннотациях ДНК . Аннотация ДНК или аннотация генома — это процесс идентификации прикрепления биологической информации к последовательностям , в частности, определения местоположения генов и определения того, что эти гены делают.

Время завершения

При секвенировании генома обычно имеются участки, которые сложно секвенировать (часто участки с высокой повторяющейся ДНК ). Таким образом, «завершенные» последовательности генома редко когда-либо бывают полными, и такие термины, как «рабочий проект» или «практически завершенный», использовались для более точного описания статуса таких геномных проектов. Даже когда каждая пара оснований последовательности генома определена, все равно могут присутствовать ошибки, поскольку секвенирование ДНК не является абсолютно точным процессом. Можно также утверждать, что проект полного генома должен включать последовательности митохондрий и (для растений) хлоропластов, поскольку эти органеллы имеют свои собственные геномы.

Часто сообщается, что целью секвенирования генома является получение информации о полном наборе генов в этой конкретной последовательности генома. Доля генома, кодирующая гены, может быть очень небольшой (особенно у эукариот , таких как человек, у которых кодирующая ДНК может составлять лишь несколько процентов всей последовательности). Однако не всегда возможно (или желательно) секвенировать только кодирующие области отдельно. Кроме того, по мере того, как ученые будут лучше понимать роль этой некодирующей ДНК (часто называемой « мусорной ДНК» ), станет более важным иметь полную последовательность генома в качестве основы для понимания генетики и биологии любого данного организма.

Во многих отношениях геномные проекты не ограничиваются только определением последовательности ДНК организма. Такие проекты могут также включать в себя предсказание генов , чтобы выяснить, где в геноме находятся гены и что они делают. Также могут быть связанные проекты по секвенированию EST или мРНК, чтобы помочь выяснить, где на самом деле находятся гены.

Исторические и технологические перспективы

Исторически сложилось так, что при секвенировании геномов эукариот (таких как червь Caenorhabditis elegans ) было обычным сначала составить карту генома, чтобы получить ряд ориентиров по всему геному. Вместо того, чтобы секвенировать хромосому за один раз, ее следует секвенировать по частям (с предварительным знанием того, где примерно этот фрагмент расположен на большей хромосоме). Изменения в технологии и, в частности, повышение вычислительной мощности компьютеров означают, что теперь геномы можно секвенировать за один раз (хотя у этого подхода есть оговорки по сравнению с традиционным подходом).

Усовершенствования в технологии секвенирования ДНК привели к тому, что стоимость секвенирования новой последовательности генома неуклонно снижается (с точки зрения стоимости пары оснований ), а новые технологии также означают, что геномы можно секвенировать гораздо быстрее.

Когда исследовательские агентства решают, какие новые геномы секвенировать, упор делается на виды, которые либо имеют большое значение в качестве модельного организма , либо имеют отношение к здоровью человека (например, патогенные бактерии или переносчики болезней, такие как комары ), либо виды, имеющие коммерческое значение ( например, патогенные бактерии или переносчики болезней, такие как комары ). например, домашний скот и сельскохозяйственные растения). Вторичный акцент делается на виды, чьи геномы помогут ответить на важные вопросы молекулярной эволюции (например, обыкновенный шимпанзе ).

В будущем, вероятно, секвенировать геном станет еще дешевле и быстрее. Это позволит определить полные последовательности генома многих разных особей одного и того же вида. Что касается людей, это позволит нам лучше понять аспекты генетического разнообразия человека .

Примеры

L1 Доминетт 01449, герефорд, участник проекта « Геном крупного рогатого скота».
Последовательность генома гигантской секвойи была извлечена из одного оплодотворенного семени, собранного с 1360-летнего дерева в национальном парке Секвойя/Кингс-Каньон .

У многих организмов есть проекты генома, которые либо уже завершены, либо будут завершены в ближайшее время, в том числе:

Смотрите также

Рекомендации

  1. ^ Певснер, Джонатан (2009). Биоинформатика и функциональная геномика (2-е изд.). Хобокен, Нью-Джерси: Уайли-Блэквелл. ISBN 9780470085851.
  2. ^ «Потенциальные преимущества исследования генома человека» . Министерство энергетики , Информация о проекте «Геном человека». 09.10.2009. Архивировано из оригинала 8 июля 2013 г. Проверено 18 июня 2010 г.
  3. ^ Ли Р, Чжу Х, Жуань Дж, Цянь В, Фан Икс, Ши З, Ли Ю, Ли С, Шан Г, Кристиансен К, Ли С, Ян Х, Ван Дж, Ван Дж (февраль 2010 г.). «Сборка геномов человека de novo с массовым параллельным секвенированием короткого чтения». Геномные исследования . 20 (2): 265–272. дои : 10.1101/гр.097261.109. ISSN  1549-5469. ПМЦ 2813482 . ПМИД  20019144. 
  4. ^ ab Расмуссен М, Ли Ю, Линдгрин С, Педерсен Дж. С., Альбрехцен А, Мольтке И, Метспалу М, Метспалу Е, Кивисилд Т, Гупта Р, Берталан М, Нильсен К, Гилберт М. Т., Ван Ю, Рагхаван М, Кампос П. Ф., Камп Х.М., Уилсон А.С., Гледхилл А., Тридико С., Банс М., Лоренцен Э.Д., Бинладен Дж., Го Икс, Чжао Дж., Чжан Х., Чжан Х., Ли З., Чен М., Орландо Л., Кристиансен К., Бак М., Томмеруп Н. , Бендиксен С, Пьер ТЛ, Гроннов Б, Мельдгаард М, Андреасен С, Федорова С.А., Осипова Л.П., Хайэм Т.Ф., Рэмси С.Б., Хансен Т.В., Нильсен ФК, Кроуфорд М.Х., Брунак С., Зихеритц-Понтен Т., Виллемс Р., Нильсен Р. , Крог А., Ван Дж., Виллерслев Э. (11 февраля 2010 г.). «Последовательность древнего человеческого генома вымершего палеоэскимоса». Природа . 463 (7282): 757–762. Бибкод : 2010Natur.463..757R. дои : 10.1038/nature08835. ISSN  1476-4687. ПМЦ 3951495 . ПМИД  20148029. 
  5. ^ Ван Дж, Ван В, Ли Р, Ли Ю, Тянь Г, Гудман Л, Фань В, Чжан Дж, Ли Дж, Чжан Дж, Го Ю, Фэн Б, Ли Х, Лу Ю, Фан Икс, Лян Х, Ду Z, Ли Д, Чжао Ю, Ху Ю, Ян З, Чжэн Х, Хеллманн И, Иноуе М, Пул Дж, И Х, Чжао Дж, Дуань Дж, Чжоу Ю, Цинь Дж, Ма Л, Ли Г, Ян З, Чжан Г, Ян Б, Ю С, Лян Ф, Ли В, Ли С, Ли Д, Ни П, Жуань Дж, Ли Q, Чжу Х, Лю Д, Лу З, Ли Н, Го Г, Чжан Дж, Йе Дж , Фан Л, Хао Ц, Чен Ц, Лян Ю, Су Ю, Сан А, Пин С, Ян С, Чен Ф, Ли Л, Чжоу К, Чжэн Х, Жэнь Ю, Ян Л, Гао Ю, Ян Г, Ли З, Фэн Х, Кристиансен К., Вонг Г.К., Нильсен Р., Дурбин Р., Болунд Л., Чжан Х, Ли С., Ян Х., Ван Дж (06.11.2008). «Диплоидная последовательность генома азиатского человека». Природа . 456 (7218): 60–65. Бибкод : 2008Natur.456...60W. дои : 10.1038/nature07484. ISSN  0028-0836. ПМК 2716080 . ПМИД  18987735. 
  6. Гош, Паллаб (23 апреля 2015 г.). «Последовательность генома мамонта завершена». Новости BBC .
  7. ^ Йейтс, Диана (23 апреля 2009 г.). «Что делает корову коровой? Последовательность генома проливает свет на эволюцию жвачных животных» (пресс-релиз) . ЭврекАлерт! . Проверено 22 декабря 2012 г.
  8. ^ Элсик, CG; Элсик, РЛ; Теллам, КК; Уорли, РА; Гиббс, DM; Музный, генеральный директор; Вайншток, Д.Л.; Адельсон, Э.Э.; Эйхлер, Л.; Ельницкий Р.; Гиго, ДЛ; Хамерник, С.М.; Каппес, штат Ха; Левин, диджей; Линн, ФРВ; Николас, А.; Реймонд, М.; Райнкельс, LC; Скоу, Э.М.; Здобнов Л.; Шук, Дж.; Вомак, Т.; Алиото, SE; Антонаракис, А.; Асташин, CE; Чаппл, Х.-К.; Чен, Дж.; Храст, Ф.; Камара, О.; и другие. (2009). «Последовательность генома тауринового крупного рогатого скота: окно в биологию и эволюцию жвачных животных». Наука . 324 (5926): 522–528. Бибкод : 2009Sci...324..522A. дои : 10.1126/science.1169588. ПМК 2943200 . ПМИД  19390049. 
  9. ^ «Выпуск 2007 г.: Собранный геном лошади» . Национальный институт исследования генома человека (NHGRI) . Проверено 19 апреля 2018 г.
  10. ^ Скотт, Элисон Д; Зимин, Алексей В; Пуйу, Даниэла; Уоркман, Рэйчел; Бриттон, Моника; Заман, Сумайра; Кабальеро, Мэдисон; Прочтите, Эндрю С.; Богданов, Адам Дж; Бернс, Эмили; Вегжин, Джилл; Тимп, Уинстон; Зальцберг, Стивен Л; Нил, Дэвид Б. (1 ноября 2020 г.). «Эталонная последовательность генома гигантской секвойи». G3: Гены, геномы, генетика . 10 (11): 3907–3919. дои : 10.1534/g3.120.401612. ПМЦ 7642918 . ПМИД  32948606. 

Внешние ссылки