Завершение секвенирования генома человека в начале 2000-х годов стало поворотным моментом в исследованиях геномики. [1] Ученые провели ряд исследований активности генов и генома в целом. Геном человека содержит около 3 миллиардов пар оснований нуклеотидов, и огромное количество созданных данных требует разработки доступного инструмента для изучения и интерпретации этой информации с целью изучения генетической основы болезней, эволюции и биологических процессов. [2] Область геномики продолжает расти, с новыми технологиями секвенирования и вычислительными инструментами, облегчающими изучение генома.
Браузер генома является важным инструментом для изучения генома. В биоинформатике браузер генома представляет собой графический интерфейс для отображения информации из биологической базы данных для геномных данных. [2] Это программный инструмент, который отображает генетические данные в графической форме. Браузеры генома позволяют пользователям визуализировать и просматривать целые геномы с аннотированными данными, включая прогнозирование генов, структуру генов, белок, экспрессию, регуляцию, вариацию и сравнительный анализ. Аннотированные данные обычно поступают из нескольких различных источников. Они отличаются от обычных биологических баз данных тем, что отображают данные в графическом формате с координатами генома на одной оси с аннотациями или заполняющей пространство графикой для показа анализов генов, таких как частота генов и их профили экспрессии. [1] Программное обеспечение позволяет пользователям перемещаться по геному, просматривать многочисленные функции, анализировать и исследовать взаимосвязи между различными геномными элементами.
Первый браузер генома, известный как Ensembl Genome Browser , был разработан в рамках проекта «Геном человека» группой исследователей из Европейского института биоинформатики (EBI). Он был создан с целью предоставления полного ресурса для последовательности генома человека с упором на аннотацию генов. Это удобный интерфейс для изучения генома человека и геномов других организмов. Было создано еще несколько браузеров генома, включая UCSC Genome Browser , разработанный в 2000 году Джимом Кентом и Дэвидом Хаусслером , и Genome Data Viewer NCBI. [ 2 ] [3]
Эти браузеры генома могут поддерживать несколько геномов, однако другие браузеры генома могут быть специфичны для определенных видов. Эти браузеры могут предоставлять сводку данных из геномных баз данных и сравнительную оценку различных генетических последовательностей среди нескольких видов, а также позволяют визуализировать данные различными способами для облегчения оценки и интерпретации этих сложных данных. [4] [5]
Genome Assembly and Annotation: Предоставляет доступ к референтной сборке генома, служащей основой для наложения и анализа других геномных данных. Они также включают генные аннотации, которые предоставляют информацию о местоположении генов, транскриптах и функциональных элементах. Не существует определенного браузера, который считается «лучшим» для геномной аннотации и сборки, поскольку в конечном итоге это зависит от конкретных потребностей пользователя и типа выполняемого анализа. Integrative Genomics Viewer (IGV): IGV — популярный браузер для визуализации и аннотирования геномных данных, включая геномные вариации, экспрессию генов и структуру хроматина. Он поддерживает широкий спектр форматов файлов и предоставляет расширенные инструменты для анализа данных.
Наложение и интеграция данных: позволяет пользователям накладывать и интегрировать различные типы геномных данных, такие как данные секвенирования ДНК, данные экспрессии генов и эпигенетические данные, на референтный геном. Это позволяет исследователям изучать взаимосвязи между различными геномными особенностями и наборами данных. Выбор наиболее подходящего браузера аннотации и сборки генома зависит от конкретных потребностей анализа и предпочтений пользователя. Однако одним из популярных вариантов визуализации и аннотации геномных данных является Integrative Genomics Viewer (IGV), который предлагает широкий спектр инструментов анализа данных и поддерживает различные форматы файлов, включая данные о геномной вариации, экспрессии генов и структуре хроматина.
Инструменты визуализации: предлагают инструменты визуализации, которые позволяют пользователям визуализировать геномные данные в различных форматах, таких как тепловые карты, линейные графики, столбчатые диаграммы и геномные треки. Эти инструменты облегчают исследование и интерпретацию сложных геномных данных в графическом формате. UCSC Genome Browser — популярный и всеобъемлющий геномный браузер, который предлагает широкий спектр инструментов визуализации для геномных данных, таких как генетическая вариация, экспрессия генов и эпигенетические модификации. Кроме того, он обеспечивает доступ к многочисленным общедоступным наборам данных для сравнительного геномного исследования. [6]
Масштабирование и навигация: Предоставьте инструменты масштабирования и навигации, которые позволяют пользователям исследовать геномные данные в разных масштабах, от всего генома до отдельных нуклеотидов. Это облегчает навигацию и фокусировку на конкретных интересующих геномных регионах. Опять же, UCSC — отличный браузер для навигации, однако NCBI на рисунке 1, как показано на рисунке ниже, имеет логическую навигацию и пользовательский интерфейс.
Поиск и извлечение: Включают функции поиска и извлечения, которые позволяют пользователям искать определенные гены, геномные регионы или функциональные элементы. Это упрощает процесс поиска и извлечения соответствующих геномных данных для анализа. Браузер NCBI [7] является ценным инструментом для геномных исследований благодаря своей обширной базе данных, удобному интерфейсу и интеграции с другими инструментами NCBI. Он предоставляет доступ к большому и разнообразному набору биологических баз данных, включая базу данных GenBank, что упрощает пользователям поиск и извлечение геномных данных. Кроме того, удобный интерфейс и расширенные параметры поиска позволяют выполнять более эффективный поиск, а интеграция с другими инструментами NCBI обеспечивает бесперебойный поиск и извлечение.
Сравнительная геномика: Некоторые геномные браузеры включают функции для сравнения и анализа геномных данных разных видов или штаммов. Это позволяет исследователям изучать эволюционные связи, определять консервативные регионы и сравнивать ортологов генов. Ensembl [8] предлагает передовые инструменты сравнительной геномики, включая возможность сравнивать структуры генов, выравнивания геномов и синтению между разными организмами.
Настройка и аннотация: позволяет пользователям настраивать отображение геномных данных, добавляя собственные аннотации, треки или визуализации. Это позволяет исследователям адаптировать интерфейс браузера к своим конкретным исследовательским потребностям и гипотезам.
Совместное использование данных и совместная работа: Содержит функции для совместного использования данных и совместной работы, такие как возможность совместного использования сеансов браузера, сохранения настроек или совместной работы с другими исследователями в режиме реального времени. Это способствует совместной работе и обмену данными между исследователями. GMOD: GMOD (база данных Generic Model Organism) — это набор инструментов с открытым исходным кодом для создания и совместного использования баз данных генома. Он предоставляет структуру для интеграции геномных данных с другими типами биологических данных, такими как протеомика и метаболомика, и позволяет совместно использовать данные и анализ с соавторами.
Инструменты анализа: Некоторые браузеры предоставляют инструменты анализа, такие как инструменты для идентификации дифференциально экспрессируемых генов, прогнозирования функциональных элементов или выполнения других вычислительных анализов геномных данных непосредственно в среде браузера.
↵Два изображения показывают функции и входные данные NCBI Genomic Browser, одного из многих. Правое изображение показывает область Chr1 человеческого гена. Поле внизу, выделенное красным, показывает настраиваемые параметры, такие как BLAST, трек по присоединению, детали сборки, история и треки/пользовательские данные. Эти функции могут различаться на разных геномных платформах.
Браузер генома отображает геном в виде серии дорожек или слоев, которые можно включать и выключать в зависимости от потребностей пользователя. Каждая дорожка представляет собой уникальную геномную особенность, такую как гены, транскрипты, регуляторную область или вариации последовательности. Пользователь может увеличивать и уменьшать масштаб определенной области генома, чтобы просматривать разный уровень детализации или дополнительную информацию, а также переходить к определенным областям с помощью функции поиска или щелчком по определенной функции.
Помимо аннотаций генов, браузеры геномов могут отображать различные типы данных, такие как:
Последовательность ДНК: ее можно изобразить в виде одной линейной дорожки или нескольких дорожек, при этом разные цвета обозначают отдельные особенности (например, экзоны , интроны и повторы).
Данные о вариациях: сюда входит информация об однонуклеотидном полиморфизме (SNP), вставках/делециях (инделах) и структурных вариантах.
Транскриптомика: содержит информацию об уровнях экспрессии генов, альтернативном сплайсинге и некодирующих РНК.
Протеомика: сюда входит информация об уровнях экспрессии белков, посттрансляционных модификациях и белок-белковых взаимодействиях.
Геномные браузеры используются в различных областях исследований, включая биоинформатику, генетику и клиническую геномику. Они позволяют исследователям изучать генетическую основу болезней, эволюции и других биологических процессов. Вот несколько примеров того, как геномные браузеры используются в различных областях:
Эволюционная биология : Геномные браузеры используются для изучения и сравнения геномов различных организмов с целью выявления сходств и различий в структуре генов, регуляторных элементах, функциях и повторяющихся последовательностях. Это может обеспечить эволюционное понимание взаимоотношений между различными видами, а также помочь определить генетические изменения, которые лежат в основе адаптации и видообразования, а также обеспечить эволюционное понимание взаимоотношений между различными видами.
Клиническая геномика: Геномные браузеры используются для изучения генетической основы заболевания. Изучая геном пациента, исследователи могут определить генетическую мутацию , которая может быть ответственна за заболевание. Геномные браузеры позволяют исследователям исследовать возможное влияние этих мутаций на экспрессию генов и функцию белков, визуализируя их в контексте генома и того, как работают белки.