Большинство последовательностей в пространстве последовательностей не имеют функции, оставляя относительно небольшие области, которые заселены естественными генами. [5] Каждая белковая последовательность соседствует со всеми другими последовательностями, которые могут быть достигнуты посредством одной мутации . [6] Было подсчитано, что все функциональное пространство белковых последовательностей было исследовано жизнью на Земле. [7] Эволюцию путем естественного отбора можно визуализировать как процесс выборки близлежащих последовательностей в пространстве последовательностей и перехода к любой из них с улучшенной приспособленностью по сравнению с текущей.
Представление
Пространство последовательностей обычно размечается как сетка. Для пространств последовательностей белков каждый остаток в белке представлен измерением с 20 возможными положениями вдоль этой оси, соответствующими возможным аминокислотам. [3] [4] Следовательно, существует 400 возможных дипептидов, расположенных в пространстве 20x20, но это расширяется до 10 130 даже для небольшого белка из 100 аминокислот, расположенных в пространстве со 100 измерениями. Хотя такая подавляющая многомерность не может быть визуализирована или представлена схематически, она предоставляет полезную абстрактную модель для размышлений о диапазоне белков и эволюции от одной последовательности к другой.
Эти многомерные пространства можно сжать до 2 или 3 измерений с помощью анализа главных компонент . Ландшафт приспособленности — это просто последовательное пространство с дополнительной вертикальной осью приспособленности, добавленной для каждой последовательности. [8]
Функциональные последовательности в пространстве последовательностей
Несмотря на разнообразие суперсемейств белков, пространство последовательностей крайне редко заполнено функциональными белками. Большинство случайных последовательностей белков не имеют складок или функций. [9] Таким образом, суперсемейства ферментов существуют как крошечные кластеры активных белков в огромном пустом пространстве нефункциональной последовательности. [10] [11]
Плотность функциональных белков в пространстве последовательностей и близость различных функций друг к другу являются ключевым фактором в понимании эволюционируемости . [12] Степень взаимопроникновения двух нейтральных сетей различных видов деятельности в пространстве последовательностей определит, насколько легко будет эволюционировать от одного вида деятельности к другому. Чем больше перекрытия между различными видами деятельности в пространстве последовательностей, тем более скрытой будет вариация для беспорядочной активности . [13]
Пространство последовательностей белков сравнивают с Вавилонской библиотекой , теоретической библиотекой, содержащей все возможные книги, длина которых составляет 410 страниц. [14] [15] В Вавилонской библиотеке найти хоть одну книгу, которая имела бы смысл, было невозможно из-за огромного количества и отсутствия порядка. То же самое было бы верно и для последовательностей белков, если бы не естественный отбор, который отбирал только те последовательности белков, которые имели смысл. Кроме того, каждая последовательность белков окружена набором соседей (точечных мутантов), которые, вероятно, имеют по крайней мере какую-то функцию.
С другой стороны, эффективный «алфавит» пространства последовательностей может быть на самом деле довольно мал, что сокращает полезное число аминокислот с 20 до гораздо меньшего числа. Например, в крайне упрощенном виде все аминокислоты можно отсортировать на два класса (гидрофобные/полярные) по гидрофобности и все равно позволить проявиться многим общим структурам. Ранняя жизнь на Земле могла иметь только четыре или пять типов аминокислот для работы, [16] и исследования показали, что функциональные белки могут быть созданы из диких типов с помощью аналогичного процесса редукции алфавита. [17] [18] Редуцированные алфавиты также полезны в биоинформатике , поскольку они обеспечивают простой способ анализа сходства белков. [19] [20]
Исследование посредством направленной эволюции и рационального проектирования
Основное внимание в области белковой инженерии уделяется созданию библиотек ДНК , которые выбирают области пространства последовательностей, часто с целью поиска мутантов белков с улучшенными функциями по сравнению с диким типом . Эти библиотеки создаются либо с использованием последовательности дикого типа в качестве шаблона и применением одного или нескольких методов мутагенеза для создания различных ее вариантов, либо путем создания белков с нуля с использованием синтеза искусственных генов . Затем эти библиотеки скринируются или отбираются , и библиотеки с улучшенными фенотипами используются для следующего раунда мутагенеза.
^ ДеПристо, Марк А.; Вайнрайх, Дэниел М.; Хартл, Дэниел Л. (2 августа 2005 г.). «Миссенс-меандринг в пространстве последовательностей: биофизический взгляд на эволюцию белков». Nature Reviews Genetics . 6 (9): 678–687. doi :10.1038/nrg1672. PMID 16074985. S2CID 13236893.
↑ Мейнард Смит, Джон (7 февраля 1970 г.). «Естественный отбор и концепция белкового пространства». Nature . 225 (5232): 563–564. Bibcode :1970Natur.225..563M. doi :10.1038/225563a0. PMID 5411867. S2CID 204994726.
^ ab Bornberg-Bauer, E.; Chan, HS (14 сентября 1999 г.). "Моделирование эволюционных ландшафтов: мутационная стабильность, топология и суперворонки в пространстве последовательностей". Труды Национальной академии наук . 96 (19): 10689–10694. Bibcode : 1999PNAS...9610689B. doi : 10.1073 /pnas.96.19.10689 . PMC 17944. PMID 10485887.
^ ab Cordes, MH; Davidson, AR; Sauer, RT (февраль 1996). "Пространство последовательностей, сворачивание и дизайн белков". Current Opinion in Structural Biology . 6 (1): 3–10. doi :10.1016/S0959-440X(96)80088-1. PMID 8696970.
^ Hermes, JD; Blacklow, SC; Knowles, JR (январь 1990 г.). «Поиск пространства последовательностей с помощью определенно случайного мутагенеза: улучшение каталитической активности фермента». Труды Национальной академии наук Соединенных Штатов Америки . 87 (2): 696–700. Bibcode : 1990PNAS...87..696H. doi : 10.1073/pnas.87.2.696 . PMC 53332. PMID 1967829 .
^ Ромеро, Филип А.; Арнольд, Фрэнсис Х. (декабрь 2009 г.). «Изучение ландшафтов приспособленности белков с помощью направленной эволюции». Nature Reviews Molecular Cell Biology . 10 (12): 866–876. doi :10.1038/nrm2805. ISSN 1471-0080. PMC 2997618. PMID 19935669 .
^ Драйден, Дэвид ТФ; Томсон, Эндрю Р.; Уайт, Джон Х. (2008). «Какая часть пространства белковых последовательностей была исследована жизнью на Земле?». Журнал интерфейса Королевского общества . 5 (25): 953–956. doi :10.1098/rsif.2008.0085. PMC 2459213. PMID 18426772 .
^ Ромеро, PA; Арнольд, FH (декабрь 2009 г.). «Изучение ландшафтов приспособленности белков с помощью направленной эволюции». Nature Reviews Molecular Cell Biology . 10 (12): 866–76. doi :10.1038/nrm2805. PMC 2997618. PMID 19935669 .
^ Keefe, AD; Szostak, JW (5 апреля 2001 г.). «Функциональные белки из библиотеки случайных последовательностей». Nature . 410 (6829): 715–8. Bibcode :2001Natur.410..715K. doi :10.1038/35070613. PMC 4476321 . PMID 11287961.
^ Stemmer, Willem PC (июнь 1995 г.). «Поиск пространства последовательностей». Био/Технология . 13 (6): 549–553. doi :10.1038/nbt0695-549. S2CID 20117819.
^ Борнберг-Бауэр, Э. (ноябрь 1997 г.). «Как модели белковых структур распределены в пространстве последовательностей?». Biophysical Journal . 73 (5): 2393–403. Bibcode :1997BpJ....73.2393B. doi :10.1016/S0006-3495(97)78268-7. PMC 1181141 . PMID 9370433.
^ Борнберг-Бауэр, Э.; Хейлманс, А.К.; Сикосек, Т. (июнь 2010 г.). «Как возникают новые белки?». Current Opinion in Structural Biology . 20 (3): 390–6. doi :10.1016/j.sbi.2010.02.005. PMID 20347587.
^ Вагнер, Андреас (2011-07-14). Истоки эволюционных инноваций: теория преобразующих изменений в живых системах . Оксфорд [и т.д.]: Oxford University Press. ISBN978-0199692590.
^ Арнольд, Ф. Х. (2000). «Библиотека Мейнарда-Смита: мой поиск смысла во вселенной белков». Достижения в области химии белков . 55 : ix–xi. doi :10.1016/s0065-3233(01)55000-7. PMID 11050930.
^ Остермайер, М (март 2007 г.). «За пределами каталогизации Вавилонской библиотеки». Химия и биология . 14 (3): 237–8. doi :10.1016/j.chembiol.2007.03.002. PMID 17379136.
^ Драйден, Д.Т.; Томсон, А.Р.; Уайт, Дж.Х. (6 августа 2008 г.). «Какая часть пространства белковых последовательностей была исследована жизнью на Земле?». Журнал Королевского общества, Интерфейс . 5 (25): 953–6. doi :10.1098/rsif.2008.0085. PMC 2459213. PMID 18426772 .
^ Аканума, С.; Кигава, Т.; Ёкояма, С. (2 октября 2002 г.). «Комбинаторный мутагенез для ограничения использования аминокислот в ферменте сокращенным набором». Труды Национальной академии наук . 99 (21): 13549–13553. Bibcode : 2002PNAS...9913549A. doi : 10.1073 /pnas.222243999 . PMC 129711. PMID 12361984.
^ Фудзисима, Косуке ; Ван, Кендрик М.; Палмер, Джесси А.; Абэ, Нозоми; Накахигаши, Кэндзи; Энди, Дрю; Ротшильд, Линн Дж. (29 января 2018 г.). «Реконструкция биосинтеза цистеина с использованием сконструированных ферментов без цистеина». Scientific Reports . 8 (1): 1776. Bibcode : 2018NatSR...8.1776F. doi : 10.1038 /s41598-018-19920-y . PMC 5788988. PMID 29379050.
^ Bacardit, Jaume; Stout, Michael; Hirst, Jonathan D; Valencia, Alfonso; Smith, Robert E; Krasnogor, Natalio (6 января 2009 г.). "Автоматизированное сокращение алфавита для наборов данных по белкам". BMC Bioinformatics . 10 (1): 6. doi : 10.1186/1471-2105-10-6 . PMC 2646702 . PMID 19126227.
^ Солис, Армандо Д. (30 июля 2019 г.). «Сокращенный алфавит пребиотических аминокислот оптимально кодирует конформационное пространство разнообразных существующих белковых складок». BMC Evolutionary Biology . 19 (1): 158. doi : 10.1186/s12862-019-1464-6 . PMC 6668081 . PMID 31362700.