Протеом — это весь набор белков , который экспрессируется или может экспрессироваться геномом , клеткой, тканью или организмом в определенное время. Это набор экспрессируемых белков в определенном типе клетки или организма в определенное время при определенных условиях. Протеомика — это изучение протеома.
Хотя термин «протеом» обычно относится к протеому организма, многоклеточные организмы могут иметь совершенно разные протеомы в разных клетках, поэтому важно различать протеомы в клетках и организмах.
Клеточный протеом — это совокупность белков, обнаруженных в определенном типе клеток при определенных условиях окружающей среды, таких как воздействие гормональной стимуляции .
Также может быть полезно рассмотреть полный протеом организма , который можно концептуализировать как полный набор белков из всех различных клеточных протеомов. Это очень грубо говоря, белковый эквивалент генома .
Термин протеом также использовался для обозначения набора белков в определенных субклеточных системах , таких как органеллы. Например, митохондриальный протеом может состоять из более чем 3000 отдельных белков. [1] [2] [3]
Белки в вирусе можно назвать вирусным протеомом . Обычно вирусные протеомы предсказываются из вирусного генома [4], но были предприняты некоторые попытки определить все белки, экспрессируемые из вирусного генома, т.е. вирусный протеом. [5] Чаще всего, однако, вирусная протеомика анализирует изменения белков хозяина при вирусной инфекции, так что фактически изучаются два протеома (вируса и его хозяина). [6]
Протеом может быть использован для сравнительного анализа различных линий раковых клеток. Протеомные исследования были использованы для определения вероятности метастазирования в линиях клеток рака мочевого пузыря KK47 и YTS1, и было обнаружено, что они имеют 36 нерегулируемых и 74 пониженно регулируемых белка. [7] Различия в экспрессии белков могут помочь идентифицировать новые механизмы сигнализации рака.
Биомаркеры рака были обнаружены с помощью масс-спектрометрического протеомного анализа. Использование протеомики или изучение протеома является шагом вперед в персонализированной медицине для адаптации лекарственных коктейлей к конкретному протеомному и геномному профилю пациента. [8] Анализ линий клеток рака яичников показал, что предполагаемые биомаркеры рака яичников включают «α-енолазу (ENOA), фактор удлинения Tu , митохондриальный (EFTU), глицеральдегид-3-фосфатдегидрогеназу (G3P) , белок стресса-70, митохондриальный (GRP75), аполипопротеин A-1 (APOA1) , пероксиредоксин (PRDX2) и аннексин A (ANXA) ». [9]
Сравнительный протеомный анализ 11 клеточных линий продемонстрировал сходство между метаболическими процессами каждой клеточной линии; в этом исследовании было полностью идентифицировано 11 731 белок. Белки домашнего хозяйства, как правило, демонстрируют большую изменчивость между клеточными линиями. [10]
Устойчивость к некоторым противораковым препаратам до сих пор не изучена. Протеомный анализ использовался для идентификации белков, которые могут обладать противораковыми свойствами, в частности, для препарата от рака толстой кишки иринотекан . [11] Исследования клеточной линии аденокарциномы LoVo показали, что 8 белков не регулируются, а 7 белков имеют пониженную регуляцию. Белки, которые показали дифференциальную экспрессию, были вовлечены в такие процессы, как транскрипция, апоптоз и пролиферация/дифференцировка клеток, среди прочих.
Протеомные анализы проводились на разных видах бактерий для оценки их метаболических реакций на различные условия. Например, на таких бактериях, как Clostridium и Bacillus , протеомные анализы использовались для изучения того, как различные белки помогают каждой из этих бактериальных спор прорастать после длительного периода покоя. [12] Чтобы лучше понять, как правильно устранять споры, необходимо провести протеомный анализ.
Марк Уилкинс ввел термин протеом [13] в 1994 году на симпозиуме «2D-электрофорез: от белковых карт до геномов», который состоялся в Сиене, Италия. Он появился в печати в 1995 году [14] с публикацией части его докторской диссертации. Уилкинс использовал этот термин для описания всего набора белков, экспрессируемых геномом, клеткой, тканью или организмом.
Геномы вирусов и прокариот кодируют относительно хорошо определенный протеом, поскольку каждый белок может быть предсказан с высокой степенью уверенности на основе его открытой рамки считывания (в вирусах от ~3 до ~1000, в бактериях от около 500 белков до около 10 000). [15] Однако большинство алгоритмов предсказания белков используют определенные пороговые значения, такие как 50 или 100 аминокислот, поэтому небольшие белки часто пропускаются такими предсказаниями. [16] У эукариот это становится намного сложнее, поскольку из большинства генов может быть произведено более одного белка из-за альтернативного сплайсинга (например, человеческий геном кодирует около 20 000 белков, но некоторые оценки предсказали 92 179 белков [ требуется цитата ] из которых 71 173 являются вариантами сплайсинга [ требуется цитата ] ). [17]
Связь размера протеома со способностью к репарации ДНК
Концепция «протеомного ограничения» заключается в том, что способность к восстановлению ДНК положительно коррелирует с информационным содержанием генома , которое, в свою очередь, приблизительно связано с размером протеома. [18] У бактерий , архей и ДНК-вирусов способность к восстановлению ДНК положительно связана с информационным содержанием генома и размером генома. [18] «Протеомное ограничение» предполагает, что модуляторы скорости мутаций, такие как гены восстановления ДНК, подвергаются давлению отбора, пропорциональному количеству информации в геноме. [18]
Протеоформы . Существуют различные факторы, которые могут добавлять вариабельность к белкам. SAP (полиморфизмы отдельных аминокислот) и несинонимичные полиморфизмы отдельных нуклеотидов (nsSNP) могут приводить к различным «протеоформам» [19] или «протеоморфам». Недавние оценки обнаружили ~135 000 подтвержденных несинонимичных cSNP, в настоящее время размещенных в SwissProt. В dbSNP есть 4,7 миллиона кандидатов cSNP, но только ~670 000 cSNP были подтверждены в 1000 геномах как несинонимичные cSNP, которые изменяют идентичность аминокислоты в белке. [19]
Темный протеом . Термин темный протеом, введенный Пердигао и коллегами, определяет области белков, которые не имеют обнаруживаемой гомологии последовательностей с другими белками известной трехмерной структуры и, следовательно, не могут быть смоделированы с помощью гомологии . Для 546 000 белков Swiss-Prot было обнаружено, что 44–54% протеома у эукариот и вирусов являются «темными», по сравнению с всего лишь ~14% у архей и бактерий . [20]
Протеом человека . В настоящее время несколько проектов направлены на картирование протеома человека, включая Human Proteome Map, ProteomicsDB, isoform.io и The Human Proteome Project (HPP). Подобно проекту генома человека , эти проекты стремятся найти и собрать доказательства для всех предсказанных генов, кодирующих белки, в геноме человека. В настоящее время (октябрь 2020 г.) Human Proteome Map заявляет о 17 294 белках, а ProteomicsDB — о 15 479 белках, используя различные критерии. 16 октября 2020 г. HPP опубликовал высокострогий план [21], охватывающий более 90% предсказанных генов, кодирующих белки. Белки идентифицируются из широкого спектра эмбриональных и взрослых тканей и типов клеток, включая гемопоэтические клетки .
Анализ белков оказывается более сложным, чем анализ последовательностей нуклеиновых кислот. Хотя ДНК состоит всего из 4 нуклеотидов, белок может состоять как минимум из 20 различных аминокислот. Кроме того, в настоящее время не существует известной высокопроизводительной технологии для создания копий одного белка. Существует множество методов изучения белков, наборов белков или всего протеома. Фактически, белки часто изучаются косвенно, например, с помощью вычислительных методов и анализа геномов. Ниже приведены лишь несколько примеров.
Протеомика , изучение протеома, в основном практикуется посредством разделения белков с помощью двумерного гель-электрофореза . В первом измерении белки разделяются с помощью изоэлектрического фокусирования , которое разделяет белки на основе заряда. Во втором измерении белки разделяются по молекулярной массе с помощью SDS-PAGE . Гель окрашивается Кумасси бриллиантовым синим или серебром для визуализации белков. Пятна на геле — это белки, которые мигрировали в определенные места.
Масс-спектрометрия является одним из ключевых методов изучения протеома. [22] Некоторые важные методы масс-спектрометрии включают масс-спектрометрию Orbitrap, MALDI (матричная лазерная десорбция/ионизация) и ESI (ионизация электрораспылением). Пептидная масс-фингерпринтинг идентифицирует белок, расщепляя его на короткие пептиды, а затем выводит идентичность белка, сопоставляя наблюдаемые массы пептидов с базой данных последовательностей . Тандемная масс-спектрометрия , с другой стороны, может получить информацию о последовательности из отдельных пептидов, изолируя их, сталкивая их с нереактивным газом, а затем каталогизируя полученные фрагментные ионы . [23]
В мае 2014 года в журнале Nature был опубликован проект карты человеческого протеома . [24] Эта карта была создана с использованием масс-спектрометрии с преобразованием Фурье высокого разрешения. В этом исследовании были профилированы 30 гистологически нормальных образцов человека, что привело к идентификации белков, кодируемых 17 294 генами. Это составляет около 84% от общего числа аннотированных генов, кодирующих белки.
Жидкостная хроматография является важным инструментом в изучении протеома. Она позволяет очень чувствительно разделять различные виды белков на основе их сродства к матрице. Некоторые новые методы разделения и идентификации белков включают использование монолитных капиллярных колонок, высокотемпературную хроматографию и капиллярную электрохроматографию. [25]
Вестерн-блоттинг можно использовать для количественной оценки обилия определенных белков. Используя антитела, специфичные к интересующему белку, можно зондировать наличие определенных белков из смеси белков.
Анализы комплементации белковых фрагментов часто используются для обнаружения белок-белковых взаимодействий . Дрожжевой двухгибридный анализ является самым популярным из них, но существуют многочисленные вариации, используемые как in vitro , так и in vivo . Анализы pull-down представляют собой метод определения партнеров по связыванию белков данного белка. [26]
Прогнозирование структуры белка может использоваться для предоставления трехмерных прогнозов структуры белка целых протеомов. В 2022 году крупномасштабное сотрудничество между EMBL-EBI и DeepMind предоставило прогнозируемые структуры для более чем 200 миллионов белков со всего древа жизни. [27] Более мелкие проекты также использовали прогнозирование структуры белка, чтобы помочь картировать протеом отдельных организмов, например, isoform.io обеспечивает покрытие нескольких изоформ белка для более чем 20 000 генов в геноме человека . [28]
Атлас белков человека содержит информацию о белках человека в клетках, тканях и органах. Все данные в ресурсе знаний находятся в открытом доступе, чтобы позволить ученым как в академической среде, так и в промышленности свободно получать доступ к данным для исследования человеческого протеома. Организация ELIXIR выбрала атлас белков в качестве основного ресурса из-за его фундаментальной важности для более широкого сообщества ученых-биологов.
База данных Plasma Proteome, архивированная 27.01.2021 в Wayback Machine, содержит информацию о 10 500 белках плазмы крови . Поскольку диапазон содержания белков в плазме очень велик, трудно обнаружить белки, которые, как правило, редки по сравнению с обильными белками. Это аналитический предел, который может быть препятствием для обнаружения белков с ультранизкими концентрациями. [29]
Такие базы данных, как neXtprot и UniProt, являются центральными ресурсами для данных по протеомике человека.