База данных Open Regulatory Annotation Database (также известная как ORegAnno ) предназначена для содействия курированию нормативной информации на уровне сообщества. В частности, база данных содержит информацию о регуляторных регионах , сайтах связывания факторов транскрипции , регуляторных вариантах и гаплотипах .
Обзор
Управление данными
Для каждой записи поддерживаются перекрестные ссылки на EnsEMBL, dbSNP, Entrez Gene, базу данных NCBI Taxonomy и PubMed. Информация в ORegAnno регулярно отображается и предоставляется в виде трека UCSC Genome Browser. Кроме того, каждая запись связана с ее экспериментальным доказательством, встроенным в качестве онтологии доказательств в ORegAnno. Это позволяет исследователю анализировать нормативные данные, используя собственные условия в отношении пригодности подтверждающих доказательств.
Программное обеспечение и доступ к данным
Проект имеет открытый исходный код — все данные и все программное обеспечение, созданное в рамках проекта, могут быть свободно доступны и использоваться.
Содержимое базы данных
По состоянию на 20 декабря 2006 года ORegAnno содержал 4220 регуляторных последовательностей (исключая устаревшие записи) для 2190 сайтов связывания факторов транскрипции, 1853 регуляторных областей (энхансеров, промоутеров и т. д.), 170 регуляторных полиморфизмов и 7 регуляторных гаплотипов для 17 различных организмов (преимущественно Drosophila melanogaster , Homo sapiens , Mus musculus , Caenorhabditis elegans и Rattus norvegicus в указанном порядке). Эти записи были получены путем ручного курирования 828 публикаций 45 пользователями ORegAnno из сообщества по регуляции генов. Очередь публикаций ORegAnno содержала 4215 публикаций, из которых 858 были закрыты, 34 находились в процессе (открытый статус) и 3321 ожидали аннотации (ожидаемый статус). ORegAnno постоянно обновляется, поэтому актуальное содержимое базы данных можно получить на сайте www.oreganno.org.
RegCreative Джамбори 2006
Слет RegCreative был инициирован общественной инициативой по постоянному хранению геномных последовательностей, которые, как было экспериментально установлено, контролируют экспрессию генов. Эта цель имеет фундаментальное значение для эволюционного анализа и трансляционных исследований, поскольку регуляторные механизмы широко вовлечены в видоспецифическую адаптацию и этиологию заболеваний. Эта инициатива завершилась формированием международного консорциума единомышленников, посвятивших себя выполнению этой задачи. Слет RegCreative стал первой возможностью для этих групп встретиться, чтобы иметь возможность точно оценить текущее состояние знаний в области регуляции генов и начать разрабатывать стандарты, по которым можно будет хранить регуляторную информацию.
Всего в семинаре приняли участие 44 исследователя из 9 стран и 23 учреждений. Финансирование также было получено от ENFIN, BioSapiens Network, FWO Research Foundation, Genome Canada и Genome British Columbia.
Конкретные результаты встречи RegCreative на сегодняшний день таковы:
- Перед RegCreative Jamboree участников попросили принять участие в оценке соглашения между аннотаторами. Были созданы два зеркала ORegAnno с идентичными наборами публикаций, которые должны были быть аннотированы в их очереди. Всего было собрано 33 избыточных аннотации из 18 публикаций. (79 аннотаций для 31 статьи и 60 аннотаций для 21 статьи были собраны на серверах 1 и 2 соответственно.) Эти усилия были использованы в качестве исходного уровня для установления эффективности аннотаторов.
- Практические занятия по аннотированию проводились в течение первых 2 дней 3-дневного семинара. В общей сложности 39 исследователей внесли 184 TFBS и 317 регуляторных областей из 96 статей. Многие из этих исследователей также прошли обучение по системе ORegAnno, что значительно увеличило сообщество ее опытных пользователей. Вклад этих аннотаций в отдельные виды составил 339 аннотаций по Homo sapiens , 42 аннотации по Mus musculus , 72 аннотации по Drosophila melanogaster , 24 аннотации по Ciona intestinalis , 14 аннотаций по Rattus norvegicus , 6 аннотаций по Halocynthia roretzi, 2 аннотации по Ciona savignyi и 2 аннотации по HIV . В рамках этих аннотаций в ORegAnno был добавлен один новый набор данных; 274 человеческих усилителя были программно аннотированы Максимиллианом Хесслером, Институт Альфреда Фессарда, из Visel et al., Nucleic Acids Research, 2006. В общей сложности, 130 научных исследований были изучены подробно. Аннотированные статьи были предварительно отобраны из публикаций, курируемых экспертами в очереди ORegAnno, полные тексты которых были доступны через HighWire Press .
- Существует насущная потребность в улучшении стандартизации данных и разработке связанных онтологий. В частности, это должно включать разработку открытого доступа и интеграцию соглашений об именовании факторов транскрипции и последовательностей, типов клеток, линий клеток, тканей и онтологий доказательств. Основа для решения и приоритизации этих потребностей была достигнута несколькими способами в ходе встречи:
- Проблемы наименования факторов транскрипции решались путем обсуждения интеграции конвейеров прогнозирования факторов транскрипции, таких как DBD или flyTF, которые были дополнены ручным курированием по сравнению с реализациями, в которых используется только ручное курирование, такими как TFcat.
- Марк Халфон из Университета Буффало провел секционное заседание по улучшению онтологии последовательностей из существующих соглашений о базах данных ORegAnno и REDfly в рамках, разрабатываемой в рамках Open Biomedical Ontologies . Предварительную версию этих улучшений можно найти на вики ORegAnno.
- Разработка онтологий на основе обучения широко рассматривалась как существенная особенность процесса аннотирования. Так что аннотаторы не ограничены в аннотировании на основе ограничений контролируемого словаря и что эти исключения могут использоваться для дальнейшей разработки магистральных онтологий.
- Разработка онтологии должна быть децентрализована из фреймворка аннотаций ORegAnno. В частности, планируется, что онтология доказательств ORegAnno будет удалена и предоставлена для более широкого сообщества разработки.
- Возобновление внимания к интеграции ресурсов, специфичных для видов, с фреймворком аннотаций.
- Особое внимание на семинаре было уделено роли текстового интеллектуального анализа в содействии нормативной аннотации. Сессии вели д-р Линетт Хиршман, MITRE, и д-р Мартин Краллингер, CNIO, чтобы сформулировать, где текстовый интеллектуальный анализ может помочь. Краткосрочная цель текстового интеллектуального анализа была сформулирована вокруг как заполнения очереди ORegAnno, так и использования экспертно-курируемой части очереди ORegAnno для проверки получения публикаций на основе текстового интеллектуального анализа. Последние цели возглавляются д-ром Стайном Аэртсом , Университет Лёвена.
Ссылки
- Montgomery SB, Griffith OL, Sleumer MC, Bergman CM, Bilenky M, Pleasance ED, Prychyna Y, Zhang X, Jones SJ (2006). "ORegAnno: база данных с открытым доступом и система курирования для полученных из литературы промоторов, сайтов связывания факторов транскрипции и регуляторных вариаций". Биоинформатика . 22 (5): 637–40. doi : 10.1093/bioinformatics/btk027 . PMID 16397004.
- Griffith OL, Montgomery SB, Bernier B, Chu B, Kasaian K, Aerts S, Mahony S, Sleumer MC, Bilenky M, Haeussler M, Griffith M, Gallo SM, Giardine B, Hooghe B, Van Loo P, Blanco E, Ticoll A, Lithwick S, Portales-Casamar E, Donaldson IJ, Robertson G, Wadelius C, De Bleser P, Vlieghe D, Halfon MS, Wasserman W, Hardison R, Bergman CM, Jones SJ, Открытый консорциум по нормативной аннотации (2008). "ORegAnno: ресурс с открытым доступом, управляемый сообществом, для нормативной аннотации". Nucleic Acids Research . 36 (выпуск базы данных): D107–13. doi :10.1093/nar/gkm967. PMC 2239002. PMID 18006570 .
- Lesurf R, Cotto KC, Wang G, Griffith M, Kasaian K, Jones SJ, Montgomery SB, Griffith OL, Открытый консорциум по нормативным аннотациям (2016). "ORegAnno 3.0: ресурс, управляемый сообществом, для курируемых нормативных аннотаций". Nucleic Acids Research . 44 (D1): D126-32. doi : 10.1093/nar/gkv1203. PMC 4702855. PMID 26578589.
Внешние ссылки
- ORegAnno
- RegCreative Джамбори 2006