stringtranslate.com

Браузер генома UCSC

Браузер генома UCSC — это онлайновый и загружаемый браузер генома , размещенный Калифорнийским университетом в Санта-Крус (UCSC). [2] [3] [4] Это интерактивный веб-сайт, предлагающий доступ к данным о последовательностях геномов различных видов позвоночных и беспозвоночных , а также основных модельных организмов , интегрированных с большой коллекцией согласованных аннотаций. Браузер — это графическое средство просмотра, оптимизированное для поддержки быстрой интерактивной работы, и представляет собой набор веб-инструментов с открытым исходным кодом, созданный на основе базы данных MySQL для быстрой визуализации, анализа и запроса данных на многих уровнях. Базу данных браузера генома, инструменты просмотра, загружаемые файлы данных и документацию можно найти на веб-сайте UCSC Genome Bioinformatics.

История

Первоначально созданный и до сих пор управляемый Джимом Кентом , тогда аспирантом, и Дэвидом Хаусслером , профессором компьютерных наук (ныне биомолекулярной инженерии) в Калифорнийском университете в Санта-Крус в 2000 году, UCSC Genome Browser начинался как ресурс для распространения первые плоды проекта «Геном человека» . При финансовой поддержке Медицинского института Говарда Хьюза и Национального института исследований генома человека NHGRI (одного из Национальных институтов здравоохранения США ) браузер предлагал графическое отображение первой полнохромосомной черновой сборки последовательности генома человека. Сегодня браузер используется генетиками, молекулярными биологами и врачами, а также студентами и преподавателями эволюции для доступа к геномной информации. [5]

Геномы

Геномы UCSC

За годы, прошедшие с момента его создания, браузер UCSC расширился и теперь включает последовательности геномов всех видов позвоночных и отдельных беспозвоночных, для которых доступны геномные последовательности с большим охватом, [6] теперь включающие 108 видов . Высокий охват необходим для обеспечения возможности перекрытия и управления строительством более крупных смежных регионов. Геномные последовательности с меньшим охватом включены в треки множественного выравнивания в некоторых браузерах, но фрагментированный характер этих сборок не делает их подходящими для создания полнофункциональных браузеров. (подробнее ниже о треках с несколькими выравниваниями). Виды, размещенные с помощью полнофункциональных геномных браузеров, показаны в таблице. [7]

Помимо этих 108 видов и их сборок, браузер генома UCSC также предлагает концентраторы сборок, доступные через Интернет каталоги геномных данных, которые можно просматривать в браузере и включать сборки, которые не размещены в нем изначально. Там пользователи могут загружать и аннотировать уникальные сборки, для которых UCSC не предоставляет базу данных аннотаций. Полный список видов и их сборок можно просмотреть на портале GenArk, включая 2589 сборок, размещенных как в базе данных браузера генома UCSC, так и в центрах сборок. Пример можно увидеть в сборочном центре проекта «Геномы позвоночных».

Функциональность браузера

Большой объем данных о биологических системах, накапливающийся в литературе, делает необходимым сбор и обработку информации с использованием инструментов биоинформатики . Браузер генома UCSC представляет разнообразную коллекцию наборов аннотаций (известных как «треки» и представленных графически), включая выравнивания мРНК, сопоставления элементов повторов ДНК, прогнозы генов, данные об экспрессии генов, данные об ассоциациях заболеваний (представляющие взаимосвязи генов). заболеваний) и картирование коммерчески доступных генных чипов (например, Illumina и Agilent ). Основная парадигма отображения состоит в том, чтобы показать последовательность генома в горизонтальном измерении и показать графическое представление местоположений мРНК, прогнозов генов и т. д. Цветные блоки вдоль оси координат показывают места выравнивания различных типов данных. . Возможность отображать такое большое разнообразие типов данных на одной оси координат делает браузер удобным инструментом для вертикальной интеграции данных. [8]

Чтобы найти конкретный ген или геномную область, пользователь может ввести название гена, последовательность ДНК, номер доступа для РНК, название геномной цитологической полосы (например, 20p13 для полосы 13 на коротком плече chr20). или положение хромосомы (chr17:38,450,000-38,531,000 для области вокруг гена BRCA1 ).

Представление данных в графическом формате позволяет браузеру представить ссылку доступа к подробной информации о любой из аннотаций. Страница сведений о гене трека UCSC Genes содержит большое количество ссылок на более конкретную информацию о гене во многих других ресурсах данных, таких как Online Mendelian Inheritance in Man ( OMIM ) и SwissProt .

Браузер UCSC, предназначенный для представления сложных и объемных данных, оптимизирован по скорости. Предварительно сопоставив миллионы последовательностей РНК из GenBank с каждой из 244 сборок генома (многие из 108 видов имеют более одной сборки), браузер обеспечивает мгновенный доступ к сопоставлению любой РНК с любым из размещенных видов.

Множественные генные продукты гена FOXP2 (вверху) и эволюционная консервативность, показанные в множественном выравнивании (внизу)

Сопоставление многих типов данных позволяет исследователям отображать именно ту комбинацию данных, которая ответит на конкретные вопросы. Функция вывода в формате pdf/postscript позволяет экспортировать изображение, готовое к съемке, для публикации в научных журналах.

Одна уникальная и полезная функция, которая отличает браузер UCSC от других браузеров генома, — это постоянно меняющийся характер отображения. Может отображаться последовательность любого размера, от одного основания ДНК до всей хромосомы (chr1 человека = 245 миллионов оснований, МБ) с полными аннотациями. Исследователи могут отображать один ген, один экзон или целую полосу хромосом, показывая десятки или сотни генов и любую комбинацию множества аннотаций. Удобная функция перетаскивания и масштабирования позволяет пользователю выбрать любую область изображения генома и развернуть ее на весь экран.

Исследователи также могут использовать браузер для отображения своих собственных данных с помощью инструмента «Пользовательские треки». Эта функция позволяет пользователям загружать файлы собственных данных и просматривать их в контексте сборки эталонного генома. Пользователи также могут использовать данные, размещенные в UCSC, создавая подмножества данных по своему выбору с помощью инструмента «Обозреватель таблиц» (например, только SNP, которые изменяют аминокислотную последовательность белка) и отображать это конкретное подмножество данных в браузере. как пользовательский трек.

Любое представление браузера, созданное пользователем, включая те, которые содержат пользовательские треки, могут быть переданы другим пользователям с помощью инструмента «Сохраненные сеансы».

Треки

Браузер генома UCSC отслеживает категории: картирование и секвенирование, гены и прогнозирование генов, фенотип и литература, COVID-19, секвенирование одноклеточной РНК, мРНК и EST.
Браузер генома UCSC отслеживает категории: регулирование, сравнительная геномика, вариации, повторы.

Под отображаемыми изображениями браузера UCSC Genome расположены одиннадцать категорий дополнительных треков, которые можно выбрать и отобразить рядом с исходными данными. Исследователи могут выбирать треки, которые лучше всего отражают их запрос, чтобы обеспечить отображение более подходящих данных в зависимости от типа и глубины проводимого исследования. Эти категории следующие:

Инструменты анализа

На сайте UCSC размещен набор инструментов анализа генома, включая полнофункциональный графический интерфейс для анализа информации в базе данных браузера, инструмент выравнивания последовательностей в формате FASTA BLAT [9] , который также полезен для простого поиска последовательностей в массивной последовательности ( геном человека = 3,23 миллиарда оснований [Гб]) любого из представленных геномов.

Инструмент LiftOver использует выравнивание всего генома, чтобы обеспечить преобразование последовательностей из одной сборки в другую или между видами. Инструмент Genome Graphs позволяет пользователям просматривать все хромосомы одновременно и отображать результаты полногеномных ассоциативных исследований (GWAS). Сортировщик генов отображает гены, сгруппированные по параметрам, не связанным с местоположением генома, например, по характеру экспрессии в тканях.

Открытый исходный код/зеркала

База кода браузера UCSC имеет открытый исходный код для некоммерческого использования и локально дублируется многими исследовательскими группами, что позволяет отображать данные в частном порядке в контексте общедоступных данных. Браузер UCSC зеркально отображается в нескольких местах по всему миру, как показано в таблице.

Код браузера также используется в отдельных установках браузером генома малярии UCSC и браузером Archaea.

Смотрите также

Рекомендации

  1. ^ Наварро Гонсалес, Дж; Цвейг, А.С.; Спейр, ML; Шмельтер, Д; Розенблум, КР; Рэйни, Би Джей; Пауэлл, CC; Нассар, ЛР; Молдинг, Северная Дакота; Ли, СМ; Ли, Британская Колумбия; Хинрикс, А.С.; Файф, AC; Фернандес, JD; Диканс, М; Клоусон, Х; Каспер, Дж; Бенет-Пажес, А; Барбер, врач общей практики; Хаусслер, Д; Кун, Р.М.; Хойсслер, М; Кент, Вашингтон (8 января 2021 г.). «База данных браузера генома UCSC: обновление 2021 года». Исследования нуклеиновых кислот . 49 (Д1): Д1046–Д1057. дои : 10.1093/nar/gkaa1070. ISSN  0305-1048. ПМК  7779060 . ПМИД  33221922.
  2. ^ Фудзита П.А., Рхед Б., Цвейг А.С., Хинрикс А.С., Карольчик Д., Клайн М.С., Голдман М., Барбер Г.П., Клоусон Х., Коэльо А., Дикханс М., Дрессер Т.Р., Джардин Б.М., Харт Р.А., Хиллман-Джексон Дж., Сюй Ф. , Киркуп В., Кун Р.М., Лернед К., Ли Ч., Мейер Л.Р., Пол А., Рэни Б.Дж., Розенблум К.Р., Смит К.Е., Хаусслер Д., Кент У.Дж. (январь 2011 г.). «База данных браузера генома UCSC: обновление 2011 г.». Нуклеиновые кислоты Рез . 39 (Проблема с базой данных): D876-82. дои : 10.1093/nar/gkq963. ПМК 3242726 . ПМИД  20959295. 
  3. ^ Кент WJ, Сагнет CW, Фьюри Т.С., Роскин К.М., Прингл Т.Х., Залер А.М., Хаусслер Д. (июнь 2002 г.). «Браузер генома человека в UCSC». Геном Рез . 12 (6): 996–1006. дои : 10.1101/гр.229102. ПМК 186604 . ПМИД  12045153. 
  4. ^ Кун, РМ; Карольчик Д.; Цвейг, А.С.; Ван, Т.; Смит, Кентукки; Розенблум, КР; Рхед, Б.; Рэйни, Би Джей; Пол, А.; Фазан, М.; Мейер, Л. (1 января 2009 г.). «База данных браузера генома UCSC: обновление 2009 г.». Исследования нуклеиновых кислот . 37 (База данных): D755–D761. дои : 10.1093/nar/gkn875. ISSN  0305-1048. ПМЦ 2686463 . ПМИД  18996895. 
  5. ^ "История | Институт геномики" . genomics.ucsc.edu . Проверено 7 августа 2022 г.
  6. ^ «Высокий охват» здесь означает шестикратное покрытие, или общая последовательность в шесть раз превышает размер генома.
  7. ^ «Браузер генома UCSC: Благодарности» . genome.ucsc.edu . Проверено 27 июля 2022 г.
  8. ^ Наварро Гонсалес, Хаиро; Цвейг, Энн С.; Спейр, Мэтью Л.; Шмельтер, Дэниел; Розенблум, Кейт Р.; Рэйни, Брайан Дж.; Пауэлл, Коннер К.; Нассар, Луис Р.; Молдинг, Натан Д.; Ли, Кристофер М.; Ли, Брайан Т. (08 января 2021 г.). «База данных браузера генома UCSC: обновление 2021 года». Исследования нуклеиновых кислот . 49 (Д1): Д1046–Д1057. дои : 10.1093/nar/gkaa1070. ISSN  1362-4962. ПМК 7779060 . ПМИД  33221922. 
  9. ^ Кент, WJ. (апрель 2002 г.). «BLAT - инструмент выравнивания, подобный BLAST». Геном Рез . 12 (4): 656–64. дои : 10.1101/гр.229202. ПМК 187518 . ПМИД  11932250. 

Внешние ссылки