stringtranslate.com

КОДИРОВАТЬ

Энциклопедия элементов ДНК ( ENCODE ) — это общественный исследовательский проект, целью которого является «создание полного списка функциональных элементов генома человека ». [2]

ENCODE также поддерживает дальнейшие биомедицинские исследования, «создавая общественные ресурсы геномных данных, программного обеспечения, инструментов и методов для анализа геномных данных, а также продуктов, полученных в результате анализа и интерпретации данных». [3] [2]

Текущая фаза ENCODE (2016–2019 гг.) увеличивает глубину ее ресурсов за счет увеличения количества типов клеток, типов данных, анализов и теперь включает поддержку исследования генома мыши. [3]

История

ENCODE был запущен Национальным институтом исследования генома человека США (NHGRI) в сентябре 2003 года. [4] [5] [6] [7] [8] Проект ENCODE, являющийся продолжением проекта «Геном человека» , направлен на идентифицировать все функциональные элементы генома человека . [9]

В проекте участвует всемирный консорциум исследовательских групп, а данные, полученные в результате этого проекта, доступны через общедоступные базы данных. Первоначальный выпуск ENCODE состоялся в 2013 году и с тех пор менялся в соответствии с рекомендациями членов консорциума и более широкого сообщества ученых, которые используют портал для доступа к данным ENCODE. Цель ENCODE, состоящая из двух частей, состоит в том, чтобы служить общедоступной базой данных для «экспериментальных протоколов, аналитических процедур и самих данных», и «один и тот же интерфейс должен обслуживать тщательно курируемые метаданные, которые фиксируют происхождение данных и обосновывают их интерпретацию». в биологическом смысле». [10] Четвертый этап проекта (ENCODE 4) начался в феврале 2017 года. [11]

Мотивация и значимость

По оценкам, у людей имеется около 20 000 генов , кодирующих белки , которые составляют около 1,5% ДНК в геноме человека. Основная цель проекта ENCODE — определить роль оставшегося компонента генома, большая часть которого традиционно считалась «мусором». Активность и экспрессия генов, кодирующих белки, могут модулироваться регуломом — различными элементами ДНК , такими как промоторы , регуляторные последовательности транскрипции, а также участки структуры хроматина и модификации гистонов . Считается, что изменения в регуляции активности генов могут нарушить выработку белка и клеточные процессы и привести к заболеванию. Определение местоположения этих регуляторных элементов и того, как они влияют на транскрипцию генов , может выявить связь между изменениями в экспрессии определенных генов и развитием заболеваний. [12]

ENCODE также задуман как комплексный ресурс, позволяющий научному сообществу лучше понять, как геном может влиять на здоровье человека, и «стимулировать разработку новых методов лечения для предотвращения и лечения этих заболеваний». [5]

а. График тенденций публикаций сообщества и консорциума ENCODE за 2007–2019 гг. b. Типы публикаций, использующих данные ENCODE, в зависимости от области исследования. [13]

Консорциум ENCODE

Консорциум ENCODE состоит в основном из ученых, финансируемых Национальным институтом исследования генома человека США (NHGRI). Другие участники, вносящие вклад в проект, включаются в Консорциум или Рабочую группу по анализу.

Пилотный этап состоял из восьми исследовательских групп и двенадцати групп, участвовавших в этапе разработки технологии ENCODE. После 2007 года число участников увеличилось до 440 ученых из 32 лабораторий по всему миру, поскольку пилотный этап официально завершился. На данный момент в консорциум входят разные центры, выполняющие разные задачи.

ENCODE является членом Международного консорциума эпигенома человека (IHEC). [14]

Основное требование NHGRI к продуктам исследований, финансируемых ENCODE, — это бесплатное и общедоступное распространение среди всех исследователей для содействия геномным исследованиям. Исследования ENCODE обеспечивают воспроизводимость и, следовательно, прозрачность программного обеспечения, методов, данных и других инструментов, связанных с геномным анализом. [3]

Проект ЭНКОД

ENCODE в настоящее время реализуется в четыре этапа: пилотный этап и этап разработки технологии, которые были начаты одновременно; [15] и на этапе производства. Четвертый этап является продолжением третьего и включает функциональную характеристику и дальнейший интегративный анализ для энциклопедии.

Целью пилотного этапа было определение набора процедур, которые в совокупности можно было бы применять экономически эффективно и с высокой производительностью для точной и всесторонней характеристики больших областей человеческого генома . Пилотный этап должен был выявить пробелы в существующем наборе инструментов для обнаружения функциональных последовательностей, а также, как предполагалось, выявить, были ли некоторые методы, использовавшиеся к тому времени, неэффективными или непригодными для широкомасштабного использования. Некоторые из этих проблем необходимо было решить на этапе разработки технологии ENCODE, целью которой было разработать новые лабораторные и вычислительные методы, которые улучшили бы нашу способность идентифицировать известные функциональные последовательности или открывать новые функциональные геномные элементы. Результаты первых двух этапов определили наилучший путь для анализа оставшихся 99% генома человека на экономически эффективном и комплексном этапе производства. [5]

Проект ENCODE Phase I: Пилотный проект

На пилотном этапе были протестированы и сравнены существующие методы для тщательного анализа определенной части последовательности генома человека. Он был организован как открытый консорциум и объединил исследователей с различным опытом и знаниями для оценки относительных достоинств каждого из разнообразного набора методов, технологий и стратегий. Параллельный этап разработки технологий проекта был направлен на разработку новых высокопроизводительных методов идентификации функциональных элементов. Целью этих усилий было определение набора подходов, которые позволили бы всесторонне идентифицировать все функциональные элементы генома человека. В рамках пилотного проекта ENCODE Национальный институт исследования генома человека (NHGRI) оценил возможность масштабирования различных подходов для анализа всего генома человека и поиска пробелов в способности идентифицировать функциональные элементы в геномной последовательности.

Процесс пилотного проекта ENCODE включал тесное взаимодействие между учеными-вычислителями и учеными-экспериментаторами для оценки ряда методов аннотирования генома человека. Набор регионов, представляющих примерно 1% (30 МБ) генома человека, был выбран в качестве цели пилотного проекта и проанализирован всеми исследователями пилотного проекта ENCODE. Все данные, полученные участниками ENCODE по этим регионам, были быстро опубликованы в общедоступных базах данных. [7] [16]

Выбор цели

Для использования в пилотном проекте ENCODE были выбраны определенные области генома человека, соответствующие 30 МБ, что составляет примерно 1% от общего генома человека. Эти регионы послужили основой для тестирования и оценки эффективности и результативности разнообразного набора методов и технологий поиска различных функциональных элементов в ДНК человека.

Прежде чем приступить к целевому выбору, было решено, что 50% из 30 МБ последовательности будут выбраны вручную, а оставшаяся последовательность будет выбрана случайным образом. Двумя основными критериями выбора областей вручную были: 1) наличие хорошо изученных генов или других известных элементов последовательности и 2) наличие значительного количества сравнительных данных о последовательностях. С помощью этого подхода вручную было выбрано в общей сложности 14,82 МБ последовательности, состоящей из 14 целей размером от 500 КБ до 2 МБ.

Остальные 50% последовательности размером 30 Мб состояли из тридцати областей по 500 т.п.н., выбранных в соответствии со стратегией стратифицированной случайной выборки, основанной на плотности генов и уровне неэкзонной консервативности. Решение использовать именно эти критерии было принято для того, чтобы обеспечить хорошую выборку геномных регионов, широко различающихся по содержанию генов и других функциональных элементов. Геном человека был разделен на три части — верхние 20%, средние 30% и нижние 50% — по каждой из двух осей: 1) плотность генов и 2) уровень неэкзонной консервативности по отношению к ортологичной геномной последовательности мыши ( см. ниже), всего девять слоев. Из каждой страты для пилотного проекта были выбраны три случайных региона. Для слоев, недостаточно представленных при ручном выборе, был выбран четвертый регион, в результате чего в общей сложности получилось 30 регионов. Для всех слоев был выделен «резервный» регион для использования на случай непредвиденных технических проблем.

Более подробно критерии стратификации были следующими:

Вышеуказанные оценки были рассчитаны в неперекрывающихся окнах размером 500 КБ готовой последовательности по всему геному и использовались для присвоения каждого окна слою. [17]

Результаты пилотного этапа

Пилотный этап был успешно завершен, и результаты были опубликованы в июне 2007 года в журнале Nature [7] и в специальном выпуске Genome Research ; [18] результаты, опубликованные в первой упомянутой статье, продвинули коллективные знания о функции человеческого генома в нескольких основных областях, включая следующие основные моменты: [7]

Проект ENCODE Phase II: Проект этапа производства

Изображение данных ENCODE в браузере генома UCSC . Здесь показано несколько треков, содержащих информацию о регуляции генов . Ген слева ( ATP2B4 ) транскрибируется в самых разных клетках (см. также данные H3K4me1 ). Ген справа транскрибируется только в нескольких типах клеток, включая эмбриональные стволовые клетки.

В сентябре 2007 года Национальный институт исследования генома человека (NHGRI) начал финансирование фазы производства проекта ENCODE. На этом этапе целью было проанализировать весь геном и провести «дополнительные пилотные исследования». [19]

Как и в пилотном проекте, производство организовано в виде открытого консорциума. В октябре 2007 года NHGRI выделил гранты на общую сумму более 80 миллионов долларов на четыре года. [20] Фаза производства также включает в себя центр координации данных, центр анализа данных и отдел разработки технологий. [21] В то время проект превратился в поистине глобальное предприятие, в котором приняли участие 440 ученых из 32 лабораторий по всему миру. После завершения пилотного этапа в 2007 году проект «расширился», получив огромную выгоду от секвенаторов нового поколения. И данные действительно были большими; исследователи собрали около 15 терабайт необработанных данных.

К 2010 году в рамках проекта ENCODE было создано более 1000 наборов полногеномных данных. В совокупности эти наборы данных показывают, какие регионы транскрибируются в РНК, какие регионы, вероятно, контролируют гены, используемые в клетках определенного типа, и какие регионы связаны с широким спектром белков. Основными анализами, используемыми в ENCODE, являются ChIP-seq , анализ гиперчувствительности ДНКазы I , RNA-seq и анализы метилирования ДНК .

Результаты этапа производства

В сентябре 2012 года проект опубликовал гораздо более обширный набор результатов: 30 статей, опубликованных одновременно в нескольких журналах, в том числе шесть в Nature , шесть в Genome Biology и специальный выпуск с 18 публикациями Genome Research . [22]

Авторы описали создание и первоначальный анализ 1640 наборов данных, предназначенных для аннотирования функциональных элементов всего генома человека, объединения результатов различных экспериментов с типами клеток, связанных экспериментов с участием 147 различных типов клеток, а также всех данных ENCODE с другими ресурсами, такими как в качестве регионов-кандидатов из полногеномных ассоциативных исследований ( GWAS ) и регионов с эволюционными ограничениями . В совокупности эти усилия выявили важные особенности организации и функций человеческого генома, которые были резюмированы в обзорном документе следующим образом: [23]

  1. Подавляющее большинство (80,4%) человеческого генома участвует по крайней мере в одном биохимическом событии, связанном с РНК и/или хроматином , по крайней мере, в одном типе клеток. Большая часть генома расположена близко к регуляторному событию: 95% генома находится в пределах 8 КБ от взаимодействия ДНК - белок (согласно анализу связанных мотивов ChIP-seq или следов DNaseI ), а 99% находится в пределах 1,7 КБ по крайней мере от одного биохимических событий, измеряемых ENCODE.
  2. Элементы, специфичные для приматов, а также элементы без обнаруживаемых ограничений млекопитающих в совокупности демонстрируют свидетельство отрицательного отбора; таким образом, ожидается, что некоторые из них будут функциональными.
  3. Классификация генома на семь состояний хроматина предполагает начальный набор из 399 124 регионов с энхансероподобными характеристиками и 70 292 регионов с промотороподобными характеристиками, а также сотни тысяч покоящихся регионов. Анализы с высоким разрешением дополнительно подразделяют геном на тысячи узких состояний с различными функциональными свойствами.
  4. Можно количественно коррелировать продукцию и процессинг последовательностей РНК как с метками хроматина , так и со связыванием фактора транскрипции (TF) на промоторах , указывая на то, что функциональность промотора может объяснить большую часть вариаций экспрессии РНК.
  5. Многие некодирующие варианты в отдельных последовательностях генома лежат в функциональных областях, аннотированных ENCODE; это число по крайней мере так же велико, как и число, содержащееся в генах, кодирующих белки.
  6. SNP , связанные с заболеванием посредством GWAS, обогащены некодирующими функциональными элементами, при этом большинство из них расположены в или рядом с определенными ENCODE областями, которые находятся за пределами генов , кодирующих белок . Во многих случаях фенотипы заболевания могут быть связаны с конкретным типом клеток или ТФ .

Самым поразительным открытием стало то, что доля биологически активной ДНК человека значительно превышает даже самые оптимистичные предыдущие оценки. В обзорном документе консорциум ENCODE сообщил, что его члены смогли приписать биохимические функции более чем 80% генома. [23] Было обнаружено, что большая часть этого участвует в контроле уровней экспрессии кодирующей ДНК , которая составляет менее 1% генома.

К наиболее важным новым элементам «энциклопедии» относятся:

Управление данными и анализ

Сбор, хранение, интеграция и отображение разнообразных генерируемых данных является сложной задачей. Координационный центр данных ENCODE (DCC) систематизирует и отображает данные, генерируемые лабораториями консорциума, и гарантирует, что данные соответствуют определенным стандартам качества, когда они публикуются. Прежде чем лаборатория представит какие-либо данные, DCC и лаборатория составляют соглашение о данных, в котором определяются параметры эксперимента и связанные с ними метаданные. DCC проверяет входящие данные на предмет соответствия соглашению. Это также гарантирует, что все данные аннотированы с использованием соответствующих онтологий . [28] Затем он загружает данные на тестовый сервер для предварительной проверки и координирует свои действия с лабораториями, чтобы организовать данные в согласованный набор треков. Когда треки готовы, команда обеспечения качества DCC выполняет серию проверок целостности, проверяет, что данные представлены в соответствии с другими данными браузера, и, возможно, самое главное, проверяет, что метаданные и сопровождающий их описательный текст представлены в виде способ, который полезен для наших пользователей. Данные публикуются на общедоступном веб-сайте UCSC Genome Browser только после того, как все эти проверки будут выполнены. Параллельно данные анализируются Центром анализа данных ENCODE — консорциумом аналитических групп из различных производственных лабораторий и других исследователей. Эти команды разрабатывают стандартизированные протоколы для анализа данных новых анализов, определения передовых методов и создания согласованного набора аналитических методов, таких как стандартизированные вызовы пиков и генерация сигналов из групп выравнивания . [29]

Национальный институт исследования генома человека (NHGRI) определил ENCODE как «проект общественных ресурсов». Эта важная концепция была определена на международной встрече, состоявшейся в Ft. Лодердейле в январе 2003 года как исследовательский проект, специально разработанный и реализованный для создания набора данных, реагентов или других материалов, основная полезность которых будет заключаться в качестве ресурса для широкого научного сообщества. Соответственно, политика выпуска данных ENCODE предусматривает, что данные после проверки будут помещены в общедоступные базы данных и доступны для использования всеми без ограничений. [29]

Другие проекты

С продолжением третьего этапа Консорциум ENCODE стал участвовать в дополнительных проектах, цели которых параллельны проекту ENCODE. Некоторые из этих проектов были частью второго этапа ENCODE.

проект modENCODE

Проект ENCyclopedia Of DNA Elements (modENCODE) организма MODEl является продолжением оригинального проекта ENCODE, направленного на идентификацию функциональных элементов в геномах выбранных модельных организмов , в частности Drosophila melanogaster и Caenorhabditis elegans . [30] Распространение на модельные организмы позволяет биологическую проверку вычислительных и экспериментальных результатов проекта ENCODE, что трудно или невозможно сделать на людях. [30] Финансирование проекта modENCODE было объявлено Национальными институтами здравоохранения (NIH) в 2007 году и включало несколько различных исследовательских институтов в США. [31] [32] Проект завершил свою работу в 2012 году.

В конце 2010 года консорциум modENCODE представил свой первый набор результатов, опубликовав в журнале Science публикации по аннотациям и интегративному анализу геномов червей и мух . [33] [34] Данные из этих публикаций доступны на веб-сайте modENCODE. [35]

modENCODE работал как исследовательская сеть, а консорциум был сформирован из 11 основных проектов, разделенных между червем и мухой. Проекты охватывали следующее:

современный

modERN, сокращение от энциклопедии регуляторных сетей модельного организма, ответвление от проекта modENCODE. Проект объединил группы C. elegans и Drosophila и направлен на идентификацию дополнительных сайтов связывания транскрипционных факторов соответствующих организмов. Проект начался одновременно с этапом III ENCODE и планирует завершиться в 2017 году. [37] На сегодняшний день в рамках проекта опубликовано 198 экспериментов, [38] около 500 других экспериментов представлены и в настоящее время обрабатываются DCC.

Геномика регуляции генов

В начале 2015 года НИЗ запустил программу «Геномика регуляции генов» (GGR). [39] Целью программы, которая продлится три года, является изучение генных сетей и путей в различных системах организма с надеждой на дальнейшее понимание механизмов, контролирующих экспрессию генов. Хотя проект ENCODE отделен от GGR, ENCODE DCC размещает данные GGR на портале ENCODE. [40]

Дорожная карта

В 2008 году НИЗ основал Консорциум картографирования эпигеномики «Дорожная карта», целью которого было создание «общественного ресурса эпигеномных данных человека для стимулирования фундаментальных исследований в области биологии и заболеваний». [41] В феврале 2015 года консорциум опубликовал статью под названием «Интегративный анализ 111 эталонных эпигеномов человека», которая достигла цели консорциума. Консорциум объединил информацию и аннотировал регуляторные элементы по 127 эталонным эпигеномам, 16 из которых были частью проекта ENCODE. [42] Данные по проекту «Дорожная карта» можно найти на портале «Дорожная карта» или на портале ENCODE.

Хронология запуска Дорожной карты Эпигенома и Международного консорциума кодирования человека (IHEC). [43]

проект FruitENCODE

FruitENCODE: энциклопедия элементов ДНК для созревания фруктов — это проект ENCODE для растений, целью которого является создание метилирования ДНК, модификаций гистонов, DHS, экспрессии генов и наборов данных о связывании факторов транскрипции для всех мясистых видов фруктов на разных стадиях развития. Предварительные данные можно найти на портале FruitENCODE.

Критика проекта

Хотя консорциум утверждает, что он еще далек от завершения проекта ENCODE, многие реакции на опубликованные статьи и освещение новостей, сопровождавших выпуск, были положительными. Редакторы журнала Nature и авторы ENCODE «... сотрудничали на протяжении многих месяцев, чтобы произвести как можно больший фурор и привлечь внимание не только исследовательского сообщества, но и общественности в целом». [44] Заявление проекта ENCODE о том, что 80% человеческого генома имеет биохимическую функцию [23], было быстро подхвачено популярной прессой, которая описала результаты проекта как ведущие к гибели мусорной ДНК . [45] [46]

Однако вывод о том, что большая часть генома является «функциональной», подвергся критике на том основании, что проект ENCODE использовал либеральное определение «функционального», а именно: все, что транскрибируется, должно быть функциональным. Этот вывод был сделан, несмотря на широко распространенное мнение, основанное на оценках геномной консервации, полученных в результате сравнительной геномики , о том, что многие элементы ДНК, такие как транскрибируемые псевдогены , тем не менее, нефункциональны. Более того, в проекте ENCODE чувствительность важнее специфичности , что может привести к обнаружению множества ложноположительных результатов . [47] [48] [49] Несколько произвольный выбор клеточных линий и факторов транскрипции, а также отсутствие соответствующих контрольных экспериментов были дополнительными серьезными критическими замечаниями в отношении ENCODE, поскольку случайная ДНК имитирует ENCODE-подобное «функциональное» поведение. [50]

В ответ на некоторые критические замечания другие ученые утверждали, что широкое распространение транскрипции и сплайсинга, наблюдаемое в геноме человека непосредственно с помощью биохимических тестов, является более точным индикатором генетической функции, чем оценки сохранения генома, поскольку все оценки сохранения относительны и их трудно поддаются оценке. выравниваются из-за невероятных различий в размерах геномов даже близкородственных видов, это частично тавтологично, и эти оценки не основаны на прямом тестировании функциональности генома. [51] [52] Оценки сохранности могут использоваться для получения подсказок для идентификации возможных функциональных элементов в геноме, но они не ограничивают и не ограничивают общее количество функциональных элементов, которые могут существовать в геноме. [52] Более того, большая часть генома, который оспаривается критиками, по-видимому, участвует в эпигенетической регуляции, такой как экспрессия генов, и, по-видимому, необходима для развития сложных организмов. [51] [53] Результаты ENCODE не обязательно были неожиданными, поскольку увеличение приписывания функциональности было предвещано предыдущими десятилетиями исследований. [51] [53] Кроме того, другие отметили, что проект ENCODE с самого начала имел цель, основанную на поиске биомедицински значимых функциональных элементов в геноме, а не эволюционных функциональных элементов, которые не обязательно являются одним и тем же, поскольку эволюционный отбор не является ни достаточным, ни необходимым для установления функции. Это очень полезный прокси для соответствующих функций, но несовершенный и не единственный. [54]

Недавно исследователи ENCODE подтвердили, что их главная цель — идентификация функциональных элементов генома человека. [55] В последующей статье, опубликованной в 2020 году, ENCODE заявила, что функциональная аннотация идентифицированных элементов «все еще находится в зачаточном состоянии». [56]

В ответ на жалобы на определение слова «функция» некоторые отметили, что ENCODE действительно определила, что оно означает, и поскольку целью ENCODE был поиск биомедицински значимых функциональных элементов в геноме, то заключение проекта следует интерпретировать « утверждая, что 80% генома участвует в соответствующих биохимических действиях, которые, весьма вероятно, будут иметь причинную роль в явлениях, которые считаются важными для биомедицинских исследований». [54] Юэн Бирни , один из исследователей ENCODE, отметил, что «функция» использовалась прагматично для обозначения «специфической биохимической активности», которая включала различные классы анализов: РНК, «широкие» модификации гистонов, «узкие» модификации гистонов, гиперчувствительность к ДНКазе I. сайты, пики ChIP-seq фактора транскрипции, следы DNaseI, мотивы, связанные с фактором транскрипции, и экзоны. [57]

В 2014 году исследователи ENCODE отметили, что в литературе функциональные части генома в предыдущих исследованиях идентифицировались по-разному в зависимости от используемых подходов. Для идентификации функциональных частей человеческого генома использовались три общих подхода: генетические подходы (которые основаны на изменениях фенотипа), эволюционные подходы (которые полагаются на сохранение) и биохимические подходы (которые основаны на биохимическом тестировании и использовались ENCODE). . Все три имеют ограничения: генетические подходы могут упускать из виду функциональные элементы, которые физически не проявляются в организме, эволюционные подходы сталкиваются с трудностями в использовании точного многовидового выравнивания последовательностей, поскольку геномы даже близкородственных видов значительно различаются, а биохимические подходы, хотя и имеют высокую воспроизводимость, биохимические признаки не всегда автоматически обозначают функцию. Они пришли к выводу, что, в отличие от эволюционных и генетических данных, биохимические данные дают представление как о молекулярной функции, которую выполняют лежащие в основе элементы ДНК, так и о типах клеток, в которых они действуют, и в конечном итоге все три подхода могут быть использованы взаимодополняющим образом для выявления областей, которые могут быть функциональными в биологии человека и заболеваниях. Кроме того, они отметили, что биохимические карты, предоставленные ENCODE, были наиболее ценными в проекте, поскольку они обеспечивают отправную точку для тестирования того, как эти сигнатуры связаны с молекулярными, клеточными и организменными функциями. [52]

Проект также подвергался критике за его высокую стоимость (всего около 400 миллионов долларов) и за поддержку большой науки, которая отнимает деньги у высокопродуктивных исследований, инициированных исследователями. [58] Стоимость пилотного проекта ENCODE оценивается в 55 миллионов долларов США; Расширение составило около 130 миллионов долларов, а Национальный институт исследования генома человека США (NHGRI) мог выделить до 123 миллионов долларов на следующий этап. Некоторые исследователи утверждают, что солидной отдачи от этих инвестиций еще предстоит увидеть. Были попытки найти в литературе статьи, в которых ENCODE играет значительную роль, и с 2012 года было опубликовано 300 статей, 110 из которых поступили из лабораторий без финансирования ENCODE. Дополнительная проблема заключается в том, что ENCODE не является уникальным названием, посвященным исключительно проекту ENCODE, поэтому слово «кодировать» встречается во многих источниках литературы по генетике и геномике. [59]

Еще одна серьезная критика заключается в том, что результаты не оправдывают количество времени, затраченного на проект, и что сам проект по сути незавершен. Хотя HGP часто сравнивают с проектом «Геном человека» (HGP) и даже называют следующим шагом HGP, у него была четкая конечная точка, которой в настоящее время нет у ENCODE.

Авторы, кажется, сочувствуют научным проблемам и в то же время пытаются оправдать свои усилия, давая интервью и объясняя детали ENCODE не только научной общественности, но и средствам массовой информации. Они также утверждают, что от осознания того, что ДНК является наследственным материалом жизни до последовательности генома человека, прошло более полувека , так что их план на следующее столетие будет состоять в том, чтобы по-настоящему понять саму последовательность. [59]

ФакторБук

Анализ данных связывания факторов транскрипции, полученный в рамках проекта ENCODE, в настоящее время доступен в доступном через Интернет репозитории FactorBook. [60] По сути, Factorbook.org представляет собой базу данных на базе Wiki для данных о связывании факторов транскрипции, созданных консорциумом ENCODE. В первом выпуске Factorbook содержит:

Смотрите также

Рекомендации

  1. ^ Хонг Э.Л., Слоан Калифорния, Чан Э.Т., Дэвидсон Дж.М., Маллади В.С., Страттан Дж.С., Хитц Б.К., Габданк И, Нараянан А.К., Хо М., Ли Б.Т., Роу Л.Д., Дресзер Т.Р., Роу Г.Р., Поддутури Н.Р., Танака Ф., Хилтон Дж. А., Черри Дж. М. (январь 2016 г.). «Принципы организации метаданных в координационном центре данных ENCODE. (обновление 2016 г.)». База данных . 2016 : baw001. doi : 10.1093/база данных/baw001. ПМЦ 4792520 . ПМИД  26980513. 
  2. ^ ab «Проект ENCODE: Обзор проекта». www.endodeproject.org . Проверено 23 февраля 2023 г.
  3. ^ abc «Политика использования данных, программного обеспечения и анализа - ENCODE» . www.encodeproject.org . Проверено 18 декабря 2021 г.
  4. ^ Рэни Б.Дж., Клайн М.С., Розенблум К.Р., Дрезер Т.Р., Лернед К., Барбер Г.П., Мейер Л.Р., Слоан К.А., Маллади В.С., Роскин К.М., Сух Б.Б., Хинрикс А.С., Клоусон Х., Цвейг А.С., Киркуп В., Фудзита П.А., Рхед Б., Смит К.Е., Пол А., Кун Р.М., Карольчик Д., Хаусслер Д., Кент У.Дж. (январь 2011 г.). «КОДИРУЙТЕ данные всего генома в браузере генома UCSC (обновление 2011 г.)». Нуклеиновые кислоты Рез. 39 (Проблема с базой данных): D871–5. дои : 10.1093/nar/gkq1017. ПМК 3013645 . ПМИД  21037257.  
  5. ^ abc Консорциум проекта ENCODE (2004). «Проект ENCODE (ЭНЦиклопедия элементов ДНК)». Наука . 306 (5696): 636–640. Бибкод : 2004Sci...306..636E. дои : 10.1126/science.1105136. PMID  15499007. S2CID  22837649.
  6. ^ Консорциум проекта ENCODE (2011). Беккер П.Б. (ред.). «Руководство пользователя по Энциклопедии элементов ДНК (ENCODE)». ПЛОС Биология . 9 (4): e1001046. дои : 10.1371/journal.pbio.1001046 . ПМК 3079585 . ПМИД  21526222.  Значок открытого доступа
  7. ^ Консорциум проекта abcd ENCODE, Бирни Э. , Стаматояннопулос Дж.А. , Дутта А. , Гиго Р., Гингерас Т.Р., Маргулис Э.Х., Венг З., Снайдер М., Дермицакис Э.Т. и др. (2007). «Идентификация и анализ функциональных элементов в 1% генома человека в рамках пилотного проекта ENCODE». Природа . 447 (7146): 799–816. Бибкод : 2007Natur.447..799B. дои : 10.1038/nature05874. ПМК 2212820 . ПМИД  17571346. 
  8. ^ Гиго Р, Фличек П., Абриль Дж. Ф., Реймонд А., Лагард Дж., Дено Ф, Антонаракис С., Эшбернер М., Бажич В. Б., Бирни Э., Кастело Р., Эйрас Э., Укла С., Гингерас Т. Р., Харроу Дж., Хаббард Т., Льюис С.Э., Риз М.Г. (2006). «EGASP: Проект оценки аннотаций генома человека ENCODE». Геномная биология . 7 (Приложение 1): С2.1–31. дои : 10.1186/gb-2006-7-s1-s2 . ПМК 1810551 . ПМИД  16925836. 
  9. ^ «Проект ENCODE: Обзор проекта» . www.endodeproject.org . Проверено 23 февраля 2023 г.
  10. ^ Дэвис, Кэрри А.; Хитц, Бенджамин К.; Слоан, Крикет А.; Чан, Эстер Т.; Дэвидсон, Джин М.; Габданк, Идан; Хилтон, Джейсон А.; Джайн, Крити; Баймурадов, Улугбек К.; Нараянан, Адити К.; Онате, Катрина К. (4 января 2018 г.). «Энциклопедия элементов ДНК (ENCODE): обновление портала данных». Исследования нуклеиновых кислот . 46 (Д1): Д794–Д801. дои : 10.1093/nar/gkx1081. ISSN  1362-4962. ПМЦ 5753278 . ПМИД  29126249. 
  11. ^ «Проект ENCODE: ЭНЦИКЛОПЕДИЯ ЭЛЕМЕНТОВ ДНК» . www.genome.gov . Проверено 13 мая 2016 г.
  12. ^ Саэй, Тина Хесман (6 октября 2012 г.). «Команда выпускает продолжение генома человека» . Общество науки и общественности . Проверено 18 октября 2012 г.
  13. ^ «Рис. 3: Публикации с использованием данных ENCODE. | Природа» . Справочник событий природы . ISSN  1476-4687.
  14. ^ GmbH, Эврис. «Соединенные Штаты Америки · IHEC». ihec-epigenomes.org . Проверено 18 июля 2017 г.
  15. ^ "Проект КОДИРОВАНИЕ" . www.genome.gov . Архивировано из оригинала 17 мая 2016 г. Проверено 16 мая 2016 г.
  16. ^ Сотрудники программы ENCODE (18 октября 2012 г.). «КОДИРОВАНИЕ: Пилотный проект: обзор». Национальный институт исследования генома человека.
  17. ^ Сотрудники программы ENCODE (19 февраля 2012 г.). «КОДИРОВАТЬ: Пилотный проект: Выбор цели». Национальный институт исследования генома человека.
  18. ^ Weinstock GM (2007). «КОДИРОВАТЬ: Больше возможностей генома». Геномные исследования . 17 (6): 667–668. дои : 10.1101/гр.6534207 . ПМИД  17567987.
  19. ^ "Genome.gov | Проекты ENCODE и modENCODE" . Проект ENCODE: ЭНЦИКЛОПЕДИЯ ЭЛЕМЕНТОВ ДНК . Национальный институт исследования генома человека США. 01.08.2011 . Проверено 5 августа 2011 г.
  20. ^ "Национальный институт исследования генома человека - Организация" . Альманах НИЗ . Национальные институты здравоохранения США . Проверено 5 августа 2011 г.
  21. ^ "Genome.gov | Участники и проекты ENCODE" . Проект ENCODE: ЭНЦИКЛОПЕДИЯ ЭЛЕМЕНТОВ ДНК . Национальный институт исследования генома человека США. 01.08.2011 . Проверено 5 августа 2011 г.
  22. ^ Экер-младший, Бикмор В.А., Баррозу И., Притчард Дж.К., Гилад Ю., Сигал Э. (сентябрь 2012 г.). «Геномика: объяснение ENCODE». Природа . 489 (7414): 52–5. Бибкод : 2012Natur.489...52E. дои : 10.1038/489052а . PMID  22955614. S2CID  5366257.
  23. ^ abc Бернштейн Б.Е., Бирни Э., Данэм I, Грин Э.Д., Гюнтер С., Снайдер М. (сентябрь 2012 г.). «Комплексная энциклопедия элементов ДНК в геноме человека». Природа . 489 (7414): 57–74. Бибкод : 2012Natur.489...57T. дои : 10.1038/nature11247. ПМЦ 3439153 . ПМИД  22955616. 
  24. ^ Турман Р.Э., Райнс Э., Умберт Р., Виерстра Дж., Маурано М.Т., Хауген Э., Шеффилд Северная Каролина, Стергачис А.Б., Ван Х. и др. (сентябрь 2012 г.). «Доступный хроматиновый ландшафт генома человека». Природа . 489 (7414): 75–82. Бибкод : 2012Natur.489...75T. дои : 10.1038/nature11232. ПМЦ 3721348 . ПМИД  22955617. 
  25. ^ Неф С., Виерстра Дж., Стергачис А.Б., Рейнольдс А.П., Хауген Э., Верно Б., Турман Р.Э., Джон С., Сандстром Р. и др. (сентябрь 2012 г.). «Обширный регуляторный лексикон человека, закодированный в следах факторов транскрипции». Природа . 489 (7414): 83–90. Бибкод : 2012Natur.489...83N. дои : 10.1038/nature11212. ПМЦ 3736582 . ПМИД  22955618. 
  26. ^ Герштейн М.Б., Кундадже А., Харихаран М., Ландт С.Г., Ян К.К., Ченг С., Му XJ, Хурана Е., Розовский Дж. и др. (сентябрь 2012 г.). «Архитектура человеческой регуляторной сети, полученная на основе данных ENCODE». Природа . 489 (7414): 91–100. Бибкод : 2012Natur.489...91G. дои : 10.1038/nature11245. ПМК 4154057 . ПМИД  22955619. 
  27. ^ Джебали С., Дэвис Калифорния, Меркель А., Добин А., Лассманн Т., Мортазави А., Танзер А., Лагард Дж., Лин В. и др. (сентябрь 2012 г.). «Ландшафт транскрипции в клетках человека». Природа . 489 (7414): 101–8. Бибкод : 2012Natur.489..101D. дои : 10.1038/nature11233. ПМЦ 3684276 . ПМИД  22955620. 
  28. ^ Маллади В.С., Эриксон Д.Т., Поддутури Н.Р., Роу Л.Д., Чан Э.Т., Дэвидсон Дж.М., Хитц Б.К., Хо М., Ли Б.Т., Миясато С., Роу Г.Р., Симисон М., Слоан К.А., Страттан Дж.С., Танака Ф., Кент В.Дж., Черри ДжМ, Хонг Э.Л. (2015). «Применение и использование онтологии в ENCODE DCC». База данных (Оксфорд) . 2015 . doi : 10.1093/database/bav010. ПМК 4360730 . ПМИД  25776021. 
  29. ^ AB Брайан Дж. Рэйни; и другие. (30 октября 2010 г.). «КОДИРУЙТЕ данные всего генома в браузере генома UCSC (обновление 2011 г.)». Нуклеиновые кислоты Рез . Исследования нуклеиновых кислот. 39 (Проблема с базой данных): D871–5. дои : 10.1093/nar/gkq1017. ПМК 3013645 . ПМИД  21037257. 
  30. ^ ab «Проект modENCODE: Энциклопедия элементов ДНК модельного организма (modENCODE)» . Сайт НХГРИ . Проверено 13 ноября 2008 г.
  31. ^ «Участники и проекты modENCODE» . Сайт НХГРИ . Проверено 13 ноября 2008 г.
  32. ^ «Лаборатория Беркли по наукам о жизни получила гранты НИЗ на исследования плодовых мух и нематод» . Сайт Национальной лаборатории Лоуренса Беркли . 14 мая 2007 г. Проверено 13 ноября 2008 г.
  33. ^ Герштейн М.Б., Лу З.Дж., Ван Ностранд Э.Л., Ченг С., Аршинофф Б.И., Лю Т., Ип К.Ю., Робилотто Р., Рехтштайнер А. и др. (2010). «Интегративный анализ генома Caenorhabditis elegans в рамках проекта modENCODE». Наука . 330 (6012): 1775–1787. Бибкод : 2010Sci...330.1775G. дои : 10.1126/science.1196914. ПМЦ 3142569 . ПМИД  21177976. 
  34. ^ Консорциум modENCODE, Рой С., Эрнст Дж., Харченко П.В., Херадпур П., Негре Н., Итон М.Л., Ландолин Дж.М., Бристоу К.А., Ма Л. и др. (2010). «Идентификация функциональных элементов и регуляторных цепей с помощью modENCODE дрозофилы». Наука . 330 (6012): 1787–1797. Бибкод : 2010Sci...330.1787R. дои : 10.1126/science.1198374. ПМК 3192495 . ПМИД  21177974. 
  35. ^ "модЭКОД". Национальный институт исследования генома человека.
  36. ^ Цельникер С (11 июня 2009 г.). «Раскрытие тайн генома». Природа . 459 (7249): 927–930. Бибкод : 2009Natur.459..927C. дои : 10.1038/459927a. ПМЦ 2843545 . ПМИД  19536255. 
  37. ^ "ОТЧЕТ ⟩ РЕПОРТЕР" .
  38. ^ «Поиск – КОДИРОВАНИЕ» .
  39. ^ «Выпуск 2015 г.: Гранты НИЗ направлены на расшифровку языка регуляции генов» . www.genome.gov . Архивировано из оригинала 6 апреля 2016 г.
  40. ^ «Поиск – КОДИРОВАНИЕ» .
  41. ^ "Дорожная карта проекта эпигеномики - Главная" .
  42. ^ Кундадже, Аншул; Меулеман, Воутер; Эрнст, Джейсон; Биленький, Миша; Йен, Анджела; Херави-Мусави, Алиреза; Херадпур, Пуя; Чжан, Чжичжоу; Ван, Цзяньжун; Зиллер, Майкл Дж.; Амин, Вирен; Уитакер, Джон В.; Шульц, Мэтью Д.; Уорд, Лукас Д.; Саркар, Абхишек; Куон, Джеральд; Сэндстром, Ричард С.; Итон, Мэтью Л.; Ву, И-Че; Пфеннинг, Андреас Р.; Ван, Синьчэнь; Клаусниццер, Мелина; Лю, Япин; Коарфа, Кристиан; Харрис, Р. Алан; Шореш, Ноам; Эпштейн, Чарльз Б.; Гьонеска, Элизабета; Люнг, Дэнни; и другие. (2015). «Интегративный анализ 111 эталонных эпигеномов человека». Природа . 518 (7539): 317–330. Бибкод : 2015Natur.518..317.. doi :10.1038/nature14248. ПМК 4530010 . ПМИД  25693563. 
  43. ^ Чо, Янг-Дан; Ким, У-Джин; Рю, Хён Мо; Ким, Хонг-Ги; Ким, Кён Хва; Ку, Янг; Сеол, Ян-Джо (26 апреля 2021 г.). «Текущие достижения эпигенетики в пародонтологии в рамках проекта ENCODE: обзор и перспективы на будущее». Клиническая эпигенетика . 13 (1): 92. дои : 10.1186/s13148-021-01074-w . ISSN  1868-7083. ПМЦ 8077755 . PMID  33902683. S2CID  233402899. 
  44. ^ Махер Б (6 сентября 2012 г.). «Борьба по поводу ENCODE и мусора». Новостной блог . Издательская группа «Природа».
  45. ^ Колата Г (05 сентября 2012 г.). «Тёмная материя ДНК вдали от «мусора» имеет решающее значение для здоровья». Нью-Йорк Таймс .
  46. ^ Грегори ТР (06 сентября 2012 г.). «Машина шумихи в СМИ ENCODE». Геномикрон.
  47. ^ Граур Д ; Чжэн Ю; Цена Н; Азеведо РБ; Зуфалл РА; Эльхайк Э (2013). «О бессмертии телевизоров: «функция» в человеческом геноме согласно неэволюционному евангелию ENCODE». Геном Биол Эвол . 5 (3): 578–90. doi : 10.1093/gbe/evt028. ПМЦ 3622293 . ПМИД  23431001. 
  48. ^ Моран Лос-Анджелес (15 марта 2013 г.). «Песчаная дорожка: о значении слова «функция»». Песчаная дорожка.
  49. ^ Грегори ТР (11 апреля 2013 г.). «Критика ENCODE в рецензируемых журналах. «Геномикрон». Геномикрон. Архивировано из оригинала 21 апреля 2013 года.
  50. ^ Уайт, Массачусетс, Майерс, Калифорния, Корбо Дж.К., Коэн Б.А. (июль 2013 г.). «Массивно-параллельный анализ энхансеров in vivo показывает, что высоколокальные особенности определяют цис-регуляторную функцию пиков ChIP-seq». Учеб. Натл. акад. наук. США . 110 (29): 11952–7. Бибкод : 2013PNAS..11011952W. дои : 10.1073/pnas.1307449110 . ПМЦ 3718143 . ПМИД  23818646. 
    • Майк Уайт (17 июля 2013 г.). «Нахождение функции в геноме с нулевой гипотезой». Финч и Пи .
  51. ^ abc Mattick JS, Dinger ME (2013). «Степень функциональности генома человека». Журнал Хьюго . 7 (1): 2. дои : 10.1186/1877-6566-7-2 . ПМЦ 4685169 . 
  52. ^ abc Келлис М. и др. (2014). «Определение функциональных элементов ДНК в геноме человека». Учеб. Натл. акад. наук. США . 111 (17): 6131–8. Бибкод : 2014PNAS..111.6131K. дои : 10.1073/pnas.1318948111 . ПМК 4035993 . ПМИД  24753594. 
  53. ^ Аб Кэри, Несса (2015). Мусорная ДНК: путешествие сквозь темную материю генома . Издательство Колумбийского университета. ISBN 9780231170840.
  54. ^ аб Жермен, Пьер-Люк; Ратти, Эмануэле; Боэм, Федерико (ноябрь 2014 г.). «Мусорная или функциональная ДНК? КОДИРОВАНИЕ и спор о функциях». Биология и философия . 29 (6): 807–831. дои : 10.1007/s10539-014-9441-3. S2CID  84480632.
  55. ^ Абаскаль Ф., Акоста Р., Аддлман Н.Дж., Адриан Дж. и др. (30 июля 2020 г.). «Расширенные энциклопедии элементов ДНК в геномах человека и мыши». Природа . 583 (7818): 699–710. Бибкод : 2020Natur.583..699E. дои : 10.1038/s41586-020-2493-4. ПМК 7410828 . PMID  32728249. Проект ENCODE направлен на точное и всестороннее определение сегментов геномов человека и мыши, которые кодируют функциональные элементы. 
  56. ^ Снайдер М.П., ​​Гингерас М.Б., Рен Б., Хардисон Р.К. и др. (2020). «Перспективы ENCODE». Природа . 583 : 583–698. Важно отметить, что хотя было определено очень большое количество некодирующих элементов, функциональная аннотация элементов, идентифицированных с помощью ENCODE, все еще находится в зачаточном состоянии.
  57. Бирни, Юэн (5 сентября 2012 г.). «КОДИРОВАТЬ: Мои собственные мысли». Блог Юэна: Биоинформатик в целом .
  58. ^ Тимпсон Т (05 марта 2013 г.). «Обсуждение ENCODE: Дэн Граур, Майкл Эйзен». Мендельспод.
  59. ^ аб Махер Б (сентябрь 2012 г.). «КОДИРОВАТЬ: Человеческая энциклопедия». Природа . 489 (7414): 46–8. дои : 10.1038/489046а . ПМИД  22962707.
  60. ^ ФакторБук
  61. ^ Ван Дж (29 ноября 2012 г.). «Factorbook.org: база данных на основе Wiki для данных о связывании факторов транскрипции, созданных консорциумом ENCODE». Исследования нуклеиновых кислот . 41 (Проблема с базой данных): D171-6. дои : 10.1093/nar/gks1221. ПМЦ 3531197 . ПМИД  23203885. 

Внешние ссылки