Протеиногенные аминокислоты — это аминокислоты , которые биосинтетически включаются в белки во время трансляции . Слово «протеиногенный» означает «создание белка». На протяжении всей известной жизни существует 22 генетически кодируемых (протеиногенных) аминокислоты, 20 из которых находятся в стандартном генетическом коде , а еще 2 ( селеноцистеин и пирролизин ) могут быть включены с помощью специальных механизмов трансляции. [1]
Напротив, непротеиногенные аминокислоты — это аминокислоты, которые либо не включены в белки (например, ГАМК , L -ДОФА или трийодтиронин ), либо неправильно включены вместо генетически закодированной аминокислоты, либо не производятся напрямую и изолированно стандартными клеточными механизмами (например, гидроксипролин ). Последнее часто является результатом посттрансляционной модификации белков. Некоторые непротеиногенные аминокислоты включены в нерибосомальные пептиды , которые синтезируются нерибосомальными пептидсинтетазами.
Как эукариоты , так и прокариоты могут включать селеноцистеин в свои белки через нуклеотидную последовательность, известную как элемент SECIS , который направляет клетку на трансляцию близлежащего кодона UGA как селеноцистеина (UGA обычно является стоп-кодоном ). У некоторых метаногенных прокариот кодон UAG (обычно стоп-кодон) также может транслироваться в пирролизин . [2]
У эукариот есть только 21 протеиногенная аминокислота, 20 из стандартного генетического кода, плюс селеноцистеин . Люди могут синтезировать 12 из них друг из друга или из других молекул промежуточного метаболизма. Остальные девять должны потребляться (обычно в виде их белковых производных), и поэтому они называются незаменимыми аминокислотами . Незаменимыми аминокислотами являются гистидин , изолейцин , лейцин , лизин , метионин , фенилаланин , треонин , триптофан и валин (т. е. H, I, L, K, M, F, T, W, V). [3]
Было обнаружено, что протеиногенные аминокислоты связаны с набором аминокислот , которые могут быть распознаны системами аутоаминоацилирования рибозима . [4] Таким образом, непротеиногенные аминокислоты были бы исключены из-за случайного эволюционного успеха форм жизни на основе нуклеотидов. Были предложены и другие причины, объясняющие, почему некоторые специфические непротеиногенные аминокислоты обычно не включаются в белки; например, орнитин и гомосерин циклизуются против пептидного остова и фрагментируют белок с относительно коротким периодом полураспада , в то время как другие токсичны, поскольку могут быть ошибочно включены в белки, такие как аналог аргинина канаванин .
Предполагается, что эволюционный отбор определенных протеиногенных аминокислот из первичного бульона обусловлен их лучшей встраиваемостью в полипептидную цепь по сравнению с непротеиногенными аминокислотами. [5]
Ниже приведены структуры и сокращения 21 аминокислоты, которые напрямую закодированы для синтеза белка генетическим кодом эукариот. Приведенные ниже структуры являются стандартными химическими структурами, а не типичными формами цвиттерионов , которые существуют в водных растворах.
IUPAC / IUBMB теперь также рекомендует стандартные сокращения для следующих двух аминокислот:
Ниже приведена таблица, в которой перечислены однобуквенные символы, трехбуквенные символы и химические свойства боковых цепей стандартных аминокислот. Перечисленные массы основаны на средневзвешенных значениях элементарных изотопов при их естественном содержании . Образование пептидной связи приводит к удалению молекулы воды . Таким образом, масса белка равна массе аминокислот, из которых состоит белок, минус 18,01524 Да на пептидную связь.
§: Значения для Asp, Cys, Glu, His, Lys и Tyr были определены с использованием аминокислотного остатка, размещенного в центре пентапептида аланина. [6] Значение для Arg взято из Pace et al. (2009). [7] Значение для Sec взято из Byun & Kang (2011). [8]
НД: Значение pKa пирролизина не сообщалось.
Примечание: Значение pKa аминокислотного остатка в небольшом пептиде обычно немного отличается, когда он находится внутри белка. Расчеты pKa белка иногда используются для расчета изменения значения pKa аминокислотного остатка в этой ситуации.
* UAG обычно является янтарным стоп-кодоном , но в организмах, содержащих биологические механизмы, кодируемые кластером генов pylTSBCD, будет включена аминокислота пирролизин. [9]
** UGA обычно является опаловым (или умбровым) стоп-кодоном, но кодирует селеноцистеин, если присутствует элемент SECIS .
† Стоп -кодон не является аминокислотой, но включен для полноты.
†† UAG и UGA не всегда действуют как стоп-кодоны (см. выше).
‡ Незаменимая аминокислота не может быть синтезирована в организме человека и, следовательно, должна поступать с пищей. Условно незаменимые аминокислоты обычно не требуются в пище, но должны поставляться экзогенно определенным популяциям, которые не синтезируют ее в достаточных количествах.
& Распространение аминокислот основано на 135 протеомах архей, 3775 бактерий, 614 эукариот и человеческом протеоме (21 006 белков) соответственно. [10]
В масс-спектрометрии пептидов и белков знание масс остатков полезно. Масса пептида или белка представляет собой сумму масс остатков плюс масса воды ( моноизотопная масса = 18,01056 Да; средняя масса = 18,0153 Да). Массы остатков рассчитываются по табличным химическим формулам и атомным весам. [11] В масс-спектрометрии ионы также могут включать один или несколько протонов ( моноизотопная масса = 1,00728 Да; средняя масса* = 1,0074 Да). *Протоны не могут иметь среднюю массу, это сбивает с толку, делая дейтроны допустимым изотопом, но они должны быть другим видом (см. Гидрон (химия) )
В таблице ниже приведено обилие аминокислот в клетках E.coli и метаболическая стоимость (АТФ) синтеза аминокислот. Отрицательные числа указывают на то, что метаболические процессы энергетически выгодны и не требуют чистой АТФ клетки. [12] Обилие аминокислот включает аминокислоты в свободной форме и в форме полимеризации (белки).
Аминокислоты можно классифицировать по свойствам их основных продуктов: [13]