Протеом — это весь набор белков , который экспрессируется или может экспрессироваться геномом , клеткой , тканью или организмом в определенное время. Это набор экспрессируемых белков в данном типе клеток или организма в данное время и в определенных условиях. Протеомика – это изучение протеома.
Хотя под протеомом обычно понимают протеом организма, многоклеточные организмы могут иметь очень разные протеомы в разных клетках, поэтому важно различать протеомы в клетках и организмах.
Клеточный протеом — это совокупность белков, обнаруженных в определенном типе клеток при определенном наборе условий окружающей среды, таких как воздействие гормональной стимуляции .
Также может быть полезно рассмотреть полный протеом организма , который можно представить как полный набор белков всех различных клеточных протеомов. Это примерно белковый эквивалент генома .
Термин «протеом» также использовался для обозначения совокупности белков в определенных субклеточных системах , таких как органеллы. Например, митохондриальный протеом может состоять из более чем 3000 различных белков. [1] [2] [3]
Белки вируса можно назвать вирусным протеомом . Обычно вирусные протеомы прогнозируются на основе вирусного генома [4] , но были предприняты некоторые попытки определить все белки, экспрессируемые из вирусного генома, т.е. вирусного протеома. [5] Однако чаще вирусная протеомика анализирует изменения белков-хозяев при вирусной инфекции, так что фактически изучаются два протеома (вируса и его хозяина). [6]
Протеом можно использовать для сравнительного анализа различных линий раковых клеток. Протеомные исследования использовались для определения вероятности метастазирования в клеточных линиях рака мочевого пузыря KK47 и YTS1, и было обнаружено, что они содержат 36 нерегулируемых и 74 отрицательно регулируемых белка. [7] Различия в экспрессии белков могут помочь идентифицировать новые механизмы передачи сигналов рака.
Биомаркеры рака были обнаружены с помощью протеомного анализа на основе масс-спектрометрии . Использование протеомики или изучение протеома является шагом вперед в персонализированной медицине для адаптации коктейлей лекарств к конкретному протеомному и геномному профилю пациента. [8] Анализ клеточных линий рака яичников показал, что предполагаемые биомаркеры рака яичников включают «α-енолазу (ENOA), фактор элонгации Tu , митохондриальную (EFTU), глицеральдегид-3-фосфатдегидрогеназу (G3P) , белок стресс-70, митохондриальные (GRP75), аполипопротеин А-1 (АПОА1) , пероксиредоксин (PRDX2) и аннексин А (ANXA) ». [9]
Сравнительный протеомный анализ 11 клеточных линий продемонстрировал сходство метаболических процессов каждой клеточной линии; В ходе этого исследования был полностью идентифицирован 11 731 белок. Белки «домашнего хозяйства», как правило, демонстрируют большую вариабельность между клеточными линиями. [10]
Устойчивость к некоторым лекарствам от рака до сих пор недостаточно изучена. Протеомный анализ использовался для идентификации белков, которые могут обладать свойствами противоракового лекарственного средства, особенно иринотекана , лекарства от рака толстой кишки . [11] Исследования клеточной линии аденокарциномы LoVo показали, что 8 белков не регулировались, а 7 белков были подавлены. Белки, которые демонстрировали дифференциальную экспрессию, были вовлечены, среди прочего, в такие процессы, как транскрипция, апоптоз и пролиферация/дифференцировка клеток.
Протеомные анализы проводились на различных видах бактерий для оценки их метаболических реакций в различных условиях. Например, в таких бактериях, как Clostridium и Bacillus , использовался протеомный анализ, чтобы исследовать, как различные белки помогают спорам каждой из этих бактерий прорастать после длительного периода покоя. [12] Чтобы лучше понять, как правильно уничтожить споры, необходимо провести протеомный анализ.
Марк Уилкинс ввел термин « протеом» [13] в 1994 году на симпозиуме «2D-электрофорез: от белковых карт к геномам», проходившем в Сиене, Италия. Оно появилось в печати в 1995 г. [14] вместе с публикацией части его кандидатской диссертации. Уилкинс использовал этот термин для описания всего набора белков , экспрессируемых геномом, клеткой, тканью или организмом.
Геномы вирусов и прокариот кодируют относительно четко определенный протеом, поскольку каждый белок можно предсказать с высокой степенью достоверности на основе его открытой рамки считывания (у вирусов от ~3 до ~1000, у бактерий от примерно 500 белков до примерно 10 000). ). [15] Однако большинство алгоритмов прогнозирования белков используют определенные пороговые значения, например 50 или 100 аминокислот, поэтому небольшие белки часто не учитываются при таких прогнозах. [16] У эукариот это становится намного сложнее, поскольку из большинства генов может быть произведено более одного белка из-за альтернативного сплайсинга (например, человеческий протеом кодирует около 20 000 белков, но по некоторым оценкам, 92 179 белков [ нужна ссылка ] из которых 71 173 подвергаются сплайсингу. варианты [ нужна ссылка ] ). [17]
Связь размера протеома со способностью репарации ДНК
Концепция «протеомного ограничения» заключается в том, что способность к репарации ДНК положительно коррелирует с информационным содержанием генома , которое, в свою очередь, приблизительно связано с размером протеома. [18] У бактерий , архей и ДНК-вирусов способность к репарации ДНК положительно связана с информационным содержанием генома и размером генома. [18] «Протеомное ограничение» предполагает, что модуляторы скорости мутаций, такие как гены репарации ДНК, подвергаются давлению отбора, пропорциональному количеству информации в геноме. [18]
Протеоформы . Существуют различные факторы, которые могут добавить изменчивости белкам. SAP (полиморфизмы одиночных аминокислот) и несинонимичные полиморфизмы одиночных нуклеотидов (nsSNP) могут приводить к различным «протеоформам» [19] или «протеоморфам». По последним оценкам, было обнаружено около 135 000 проверенных несинонимичных cSNP, которые в настоящее время размещены в SwissProt. В dbSNP имеется 4,7 миллиона cSNP-кандидатов, но только около 670 000 cSNP были проверены в 1000 геномах, установленных как несинонимичные cSNP, которые изменяют идентичность аминокислоты в белке. [19]
Темный протеом . Термин «темный протеом» , введенный Пердигао и его коллегами, определяет области белков, которые не имеют заметной гомологии последовательностей с другими белками известной трехмерной структуры и, следовательно, не могут быть смоделированы с помощью гомологии . Было обнаружено , что для 546 000 белков Swiss-Prot 44–54% протеома у эукариот и вирусов оказались «темными» по сравнению только с ~ 14% у архей и бактерий . [20]
Протеом человека . В настоящее время несколько проектов направлены на картирование протеома человека, в том числе «Карта протеома человека», ProteomicsDB, isoform.io и «Проект протеома человека» (HPP). Подобно проекту генома человека , эти проекты направлены на поиск и сбор доказательств существования всех предсказанных генов, кодирующих белки, в геноме человека. Карта протеома человека на данный момент (октябрь 2020 г.) содержит 17 294 белка, а ProteomicsDB - 15 479 с использованием различных критериев. 16 октября 2020 года HPP опубликовала строгий план [21] , охватывающий более 90% предсказанных генов, кодирующих белки. Белки идентифицируются из широкого спектра тканей и типов клеток плода и взрослого человека, включая гемопоэтические клетки .
Анализ белков оказывается более трудным, чем анализ последовательностей нуклеиновых кислот. Хотя в состав ДНК входит всего 4 нуклеотида, белок может состоять как минимум из 20 различных аминокислот. Кроме того, в настоящее время не существует известной высокопроизводительной технологии создания копий одного белка. Доступно множество методов изучения белков, наборов белков или всего протеома. Фактически, белки часто изучаются косвенно, например, с использованием вычислительных методов и анализа геномов. Ниже приведены лишь несколько примеров.
Протеомика , изучение протеома, в основном практикуется путем разделения белков с помощью двумерного гель-электрофореза . В первом измерении белки разделяются с помощью изоэлектрического фокусирования , которое разделяет белки на основе заряда. Во втором измерении белки разделяются по молекулярной массе с помощью SDS-PAGE . Гель окрашивают кумасси бриллиантовым синим или серебром для визуализации белков. Пятна на геле представляют собой белки, мигрировавшие в определенные места.
Масс-спектрометрия — один из ключевых методов изучения протеома. [22] Некоторые важные методы масс-спектрометрии включают масс-спектрометрию с орбитальной ловушкой, MALDI (лазерная десорбция / ионизация с матрицей) и ESI (ионизация электрораспылением). Снятие отпечатков пальцев пептидной массы идентифицирует белок путем расщепления его на короткие пептиды, а затем определяет идентичность белка путем сопоставления наблюдаемых масс пептидов с базой данных последовательностей . С другой стороны, тандемная масс-спектрометрия может получить информацию о последовательности отдельных пептидов, изолируя их, сталкивая их с нереактивным газом, а затем каталогизируя образующиеся фрагментные ионы . [23]
В мае 2014 года в журнале Nature был опубликован проект карты протеома человека . [24] Эта карта была создана с использованием масс-спектрометрии с преобразованием Фурье высокого разрешения. В ходе этого исследования были профилированы 30 гистологически нормальных человеческих образцов, в результате чего были идентифицированы белки, кодируемые 17 294 генами. Это составляет около 84% от общего числа аннотированных генов, кодирующих белок.
Жидкостная хроматография является важным инструментом в изучении протеома. Он позволяет очень чувствительно разделять различные виды белков на основе их сродства к матрице. Некоторые новые методы разделения и идентификации белков включают использование монолитных капиллярных колонок, высокотемпературную хроматографию и капиллярную электрохроматографию. [25]
Вестерн-блоттинг можно использовать для количественной оценки содержания определенных белков. Используя антитела, специфичные к интересующему белку, можно проверить наличие специфических белков в смеси белков.
Анализы комплементации белковых фрагментов часто используются для обнаружения белок-белковых взаимодействий . Двугибридный дрожжевой анализ является наиболее популярным из них, но существует множество его вариаций, используемых как in vitro , так и in vivo . Анализы Pull-Down — это метод определения того, с какими типами белков взаимодействует тот или иной белок. [26]
Прогнозирование структуры белка можно использовать для прогнозирования трехмерной структуры белка целых протеомов. В 2022 году крупномасштабное сотрудничество между EMBL-EBI и DeepMind позволило предсказать структуры более чем 200 миллионов белков со всего древа жизни. [27] В более мелких проектах также используется предсказание структуры белка, чтобы помочь составить карту протеома отдельных организмов, например, isoform.io обеспечивает охват множества изоформ белка для более чем 20 000 генов в геноме человека . [28]
Атлас белков человека содержит информацию о белках человека в клетках, тканях и органах. Все данные в ресурсе знаний находятся в открытом доступе, что позволяет ученым как в академических кругах, так и в промышленности иметь свободный доступ к данным для исследования протеома человека. Организация ELIXIR выбрала атлас белков в качестве основного ресурса из-за его фундаментальной важности для более широкого сообщества медико-биологических наук.
База данных Plasma Proteome содержит информацию о 10 500 белках плазмы крови . Поскольку диапазон содержания белка в плазме очень велик, трудно обнаружить белки, которых, как правило, мало по сравнению с белками в большом количестве. Это аналитический предел, который, возможно, может стать барьером для обнаружения белков в сверхнизких концентрациях. [29]
Такие базы данных, как neXtprot и UniProt, являются центральными ресурсами для протеомных данных человека.