stringtranslate.com

Проект генома

В распечатанном виде последовательность генома человека занимает около 100 огромных томов мелкого шрифта.

Геномные проекты — это научные начинания, которые в конечном итоге направлены на определение полной последовательности генома организма (будь то животное , растение , гриб , бактерия , архея , простейший или вирус ) и на аннотацию генов , кодирующих белок , и других важных особенностей, кодируемых геномом. [1] Последовательность генома организма включает коллективные последовательности ДНК каждой хромосомы в организме. Для бактерии , содержащей одну хромосому, геномный проект будет направлен на картирование последовательности этой хромосомы. Для человеческого вида, геном которого включает 22 пары аутосом и 2 половые хромосомы, полная последовательность генома будет включать 46 отдельных последовательностей хромосом.

Проект «Геном человека» — хорошо известный пример проекта по изучению генома. [2]

Сборка генома

Сборка генома относится к процессу взятия большого количества коротких последовательностей ДНК и их повторной сборки для создания представления исходных хромосом , из которых произошла ДНК. В проекте дробового секвенирования вся ДНК из источника (обычно одного организма , от бактерии до млекопитающего ) сначала разбивается на миллионы маленьких кусочков. Затем эти кусочки «считываются» автоматизированными машинами для секвенирования. Алгоритм сборки генома работает, беря все кусочки и выравнивая их друг с другом, и обнаруживая все места, где две короткие последовательности, или прочтения , перекрываются. Эти перекрывающиеся прочтения можно объединить, и процесс продолжится.

Сборка генома — очень сложная вычислительная задача, которая усложняется тем, что многие геномы содержат большое количество идентичных последовательностей, известных как повторы . Эти повторы могут быть длиной в тысячи нуклеотидов и встречаться в разных местах, особенно в больших геномах растений и животных .

Результирующая (черновая) последовательность генома получается путем объединения секвенированных контигов информации и последующего использования связующей информации для создания каркасов. Каркасы располагаются вдоль физической карты хромосом, создавая «золотой путь».

Программное обеспечение для сборки

Первоначально большинство крупных центров секвенирования ДНК разрабатывали собственное программное обеспечение для сборки полученных ими последовательностей. Однако это изменилось по мере усложнения программного обеспечения и увеличения числа центров секвенирования. Пример такого ассемблера Пакет анализа коротких олигонуклеотидов, разработанный BGI для сборки de novo человеческих геномов, выравнивания, обнаружения SNP , повторного секвенирования, поиска инделей и анализа структурных вариаций. [3] [4] [5]

Аннотация генома

Начиная с 1980-х годов молекулярная биология и биоинформатика создали потребность в аннотации ДНК . Аннотация ДНК или аннотация генома — это процесс идентификации и присоединения биологической информации к последовательностям , в частности, при идентификации местоположений генов и определении того, что делают эти гены.

Время завершения

При секвенировании генома обычно есть области, которые трудно секвенировать (часто области с высокой повторяемостью ДНК ). Таким образом, «завершенные» последовательности генома редко когда-либо бывают полными, и такие термины, как «рабочий проект» или «в основном завершенный», использовались для более точного описания статуса таких геномных проектов. Даже когда каждая пара оснований последовательности генома была определена, все равно, вероятно, будут присутствовать ошибки, поскольку секвенирование ДНК не является абсолютно точным процессом. Можно также утверждать, что полный геномный проект должен включать последовательности митохондрий и (для растений) хлоропластов, поскольку эти органеллы имеют свои собственные геномы.

Часто сообщается, что целью секвенирования генома является получение информации о полном наборе генов в этой конкретной последовательности генома. Доля генома, которая кодирует гены, может быть очень мала (особенно у эукариот , таких как люди, где кодирующая ДНК может составлять всего несколько процентов от всей последовательности). Однако не всегда возможно (или желательно) секвенировать только кодирующие области по отдельности. Кроме того, по мере того, как ученые больше узнают о роли этой некодирующей ДНК (часто называемой мусорной ДНК ), станет более важным иметь полную последовательность генома в качестве основы для понимания генетики и биологии любого данного организма.

Во многих отношениях геномные проекты не ограничиваются только определением последовательности ДНК организма. Такие проекты могут также включать предсказание генов , чтобы выяснить, где находятся гены в геноме и что эти гены делают. Могут также быть связанные проекты по секвенированию EST или мРНК, чтобы помочь выяснить, где на самом деле находятся гены.

Исторические и технологические перспективы

Исторически сложилось так, что при секвенировании геномов эукариот (например, червя Caenorhabditis elegans ) было принято сначала картировать геном, чтобы обеспечить ряд ориентиров по всему геному. Вместо того, чтобы секвенировать хромосому за один раз, она секвенировалась бы по частям (с предварительным знанием приблизительного расположения этой части на более крупной хромосоме). Изменения в технологии и, в частности, улучшение вычислительной мощности компьютеров, означает, что геномы теперь можно « секвенировать дробовиком » за один раз (хотя есть оговорки по сравнению с традиционным подходом).

Усовершенствования в технологии секвенирования ДНК привели к тому, что стоимость секвенирования новой последовательности генома неуклонно снижалась (в пересчете на стоимость пары оснований ), а новые технологии также привели к тому, что геномы можно секвенировать гораздо быстрее.

Когда исследовательские агентства решают, какие новые геномы секвенировать, акцент делается на видах, которые либо имеют большое значение как модельные организмы , либо имеют отношение к здоровью человека (например, патогенные бактерии или переносчики болезней, такие как комары ), либо на видах, которые имеют коммерческое значение (например, домашний скот и сельскохозяйственные культуры). Вторичный акцент делается на видах, геномы которых помогут ответить на важные вопросы молекулярной эволюции (например, обыкновенный шимпанзе ).

В будущем, вероятно, станет еще дешевле и быстрее секвенировать геном. Это позволит определять полные последовательности генома у многих разных особей одного вида. Для людей это позволит нам лучше понять аспекты человеческого генетического разнообразия .

Примеры

L1 Доминетт 01449, корова породы Герефорд, которая является объектом проекта «Геном крупного рогатого скота»
Последовательность генома гигантской секвойи была извлечена из одного оплодотворенного семени, собранного с 1360-летнего дерева в национальном парке Секвойя/Кингз-Каньон .

Геномные проекты многих организмов либо уже завершены, либо будут завершены в ближайшее время, в том числе:

Смотрите также

Ссылки

  1. ^ Певзнер, Джонатан (2009). Биоинформатика и функциональная геномика (2-е изд.). Хобокен, Нью-Джерси: Wiley-Blackwell. ISBN 9780470085851.
  2. ^ "Потенциальные преимущества исследований проекта "Геном человека"". Министерство энергетики , Информация о проекте "Геном человека". 2009-10-09. Архивировано из оригинала 2013-07-08 . Получено 2010-06-18 .
  3. ^ Li R, Zhu H, Ruan J, Qian W, Fang X, Shi Z, Li Y, Li S, Shan G, Kristiansen K, Li S, Yang H, Wang J, Wang J (февраль 2010 г.). «Сборка человеческих геномов de novo с помощью массивно-параллельного секвенирования коротких прочтений». Genome Research . 20 (2): 265–272. doi :10.1101/gr.097261.109. ISSN  1549-5469. PMC 2813482 . PMID  20019144. 
  4. ^ ab Расмуссен М, Ли Ю, Линдгрин С, Педерсен Дж. С., Альбрехцен А, Мольтке И, Метспалу М, Метспалу Е, Кивисилд Т, Гупта Р, Берталан М, Нильсен К, Гилберт М. Т., Ван Ю, Рагхаван М, Кампос П. Ф., Камп Х.М., Уилсон А.С., Гледхилл А., Тридико С., Банс М., Лоренцен Э.Д., Бинладен Дж., Го Икс, Чжао Дж., Чжан Х., Чжан Х., Ли З., Чен М., Орландо Л., Кристиансен К., Бак М., Томмерап Н. , Бендиксен С, Пьер ТЛ, Гроннов Б, Мельдгаард М, Андреасен С, Федорова С.А., Осипова Л.П., Хайэм Т.Ф., Рэмси С.Б., Хансен ТВ, Нильсен ФК, Кроуфорд М.Х., Брунак С., Зихеритц-Понтен T, Villems R, Nielsen R, Krogh A, Wang J, Willerslev E (2010-02-11). "Древняя последовательность генома человека вымершего палеоэскимоса". Nature . 463 (7282): 757–762. Bibcode : 2010Natur.463..757R. doi :10.1038/nature08835. ISSN  1476-4687. PMC 3951495. PMID 20148029  . 
  5. ^ Ван Дж, Ван В, Ли Р, Ли Ю, Тянь Г, Гудман Л, Фань В, Чжан Дж, Ли Дж, Чжан Дж, Го Ю, Фэн Б, Ли Х, Лу Ю, Фан Икс, Лян Х, Ду Z, Ли Д, Чжао Ю, Ху Ю, Ян З, Чжэн Х, Хеллманн И, Иноуе М, Пул Дж, И Х, Чжао Дж, Дуань Дж, Чжоу Ю, Цинь Дж, Ма Л, Ли Г, Ян З, Чжан Г, Ян Б, Ю С, Лян Ф, Ли В, Ли С, Ли Д, Ни П, Жуань Дж, Ли Q, Чжу Х, Лю Д, Лу З, Ли Н, Го Г, Чжан Дж, Йе Дж , Фан Л, Хао Ц, Чен Ц, Лян Ю, Су Ю, Сан А, Пин С, Ян С, Чен Ф, Ли Л, Чжоу К, Чжэн Х, Жэнь Ю, Ян Л, Гао Ю, Ян G, Li Z, Feng X, Kristiansen K, Wong GK, Nielsen R, Durbin R, Bolund L, Zhang X, Li S, Yang H, Wang J (2008-11-06). "Диплоидная последовательность генома азиатской индивидуальная". Nature . 456 (7218): 60–65. Bibcode :2008Natur.456...60W. doi :10.1038/nature07484. ISSN  0028-0836. PMC 2716080 . PMID  18987735. 
  6. ^ Гош, Паллаб (23 апреля 2015 г.). «Геном мамонта расшифрован». BBC News .
  7. ^ Йейтс, Диана (2009-04-23). ​​"Что делает корову коровой? Последовательность генома проливает свет на эволюцию жвачных" (пресс-релиз) . EurekAlert!. Получено 2012-12-22 .
  8. ^ Elsik, CG; Elsik, RL; Tellam, KC; Worley, RA; Gibbs, DM; Muzny, GM; Weinstock, DL; Adelson, EE; Eichler, L.; Elnitski, R.; Guigó, DL; Hamernik, SM; Kappes, HA; Lewin, DJ; Lynn, FW; Nicholas, A.; Reymond, M.; Rijnkels, LC; Skow, EM; Zdobnov, L.; Schook, J.; Womack, T.; Alioto, SE; Antonarakis, A.; Astashyn, CE; Chapple, H. -C.; Chen, J.; Chrast, F.; Câmara, O.; et al. (2009). «Последовательность генома таурина крупного рогатого скота: окно в биологию и эволюцию жвачных животных». Science . 324 (5926): 522–528. Bibcode :2009Sci...324..522A. doi :10.1126/science.1169588. PMC 2943200 . PMID  19390049. 
  9. ^ "Выпуск 2007: Геном лошади собран". Национальный институт исследований генома человека (NHGRI) . Получено 19 апреля 2018 г.
  10. ^ Скотт, Элисон Д.; Зимин, Алексей В.; Пуйу, Даниэла; Воркман, Рэйчел; Бриттон, Моника; Заман, Сумайра; Кабальеро, Мэдисон; Рид, Эндрю К.; Богданов, Адам Дж.; Бернс, Эмили; Вегжин, Джилл; Тимп, Уинстон; Зальцберг, Стивен Л.; Нил, Дэвид Б. (1 ноября 2020 г.). «Эталонная последовательность генома гигантской секвойи». G3: Гены, геномы, генетика . 10 (11): 3907–3919. doi :10.1534/g3.120.401612. PMC 7642918. PMID  32948606 . 

Внешние ссылки