Секвенирование отдельных клеток исследует информацию о последовательности нуклеиновых кислот из отдельных клеток с помощью оптимизированных технологий секвенирования следующего поколения , обеспечивая более высокое разрешение клеточных различий и лучшее понимание функции отдельной клетки в контексте ее микроокружения. [1] Например, при раке секвенирование ДНК отдельных клеток может дать информацию о мутациях, переносимых небольшими популяциями клеток. В развитии секвенирование РНК, экспрессируемых отдельными клетками, может дать представление о существовании и поведении различных типов клеток. [2] В микробных системах популяция одного и того же вида может казаться генетически клонированной. Тем не менее, секвенирование РНК или эпигенетических модификаций отдельных клеток может выявить изменчивость от клетки к клетке, которая может помочь популяциям быстро адаптироваться для выживания в изменяющихся условиях. [3]
Типичная клетка человека состоит из примерно 2 x 3,3 миллиарда пар оснований ДНК и 600 миллионов оснований мРНК. Обычно для секвенирования ДНК или РНК с использованием традиционных методов, таких как секвенирование по Сэнгеру или секвенирование следующего поколения , используется смесь миллионов клеток . С помощью глубокого секвенирования ДНК и РНК из одной клетки можно подробно исследовать клеточные функции. [1] Как и типичные эксперименты по секвенированию следующего поколения, протоколы секвенирования отдельных клеток обычно содержат следующие этапы: изоляция отдельной клетки, извлечение и амплификация нуклеиновой кислоты, подготовка библиотеки секвенирования , секвенирование и анализ биоинформатических данных. Выполнять секвенирование отдельных клеток сложнее, чем секвенирование из клеток в большом количестве. Минимальное количество исходных материалов из одной клетки приводит к тому, что деградация, потеря образца и загрязнение оказывают выраженное влияние на качество данных секвенирования. Кроме того, из-за пикограммового уровня количества используемых нуклеиновых кислот [4] во время подготовки образцов для секвенирования отдельных клеток часто требуется интенсивная амплификация, что приводит к неравномерному покрытию, шуму и неточной количественной оценке данных секвенирования.
Недавние технические усовершенствования делают секвенирование отдельных клеток многообещающим инструментом для решения ряда, казалось бы, недоступных проблем. Например, гетерогенные образцы, редкие типы клеток, связи клеточных линий, мозаицизм соматических тканей, анализ микробов, которые невозможно культивировать, и эволюция заболеваний — все это можно выяснить с помощью секвенирования отдельных клеток. [5] Секвенирование отдельных клеток было выбрано Nature Publishing Group в качестве метода 2013 года. [6]
Секвенирование генома ДНК отдельных клеток включает в себя изоляцию отдельной клетки, амплификацию всего генома или интересующей области, построение библиотек секвенирования и последующее применение секвенирования ДНК следующего поколения (например, Illumina , Ion Torrent ). Секвенирование ДНК отдельных клеток широко применяется в системах млекопитающих для изучения нормальной физиологии и заболеваний. Разрешение отдельных клеток может раскрыть роль генетического мозаицизма или внутриопухолевой генетической гетерогенности в развитии рака или ответе на лечение. [7] В контексте микробиомов геном одного одноклеточного организма называется единым амплифицированным геномом (SAG). Достижения в секвенировании ДНК отдельных клеток позволили собрать геномные данные из некультивируемых прокариотических видов, присутствующих в сложных микробиомах. [8] Хотя SAG характеризуются низкой полнотой и значительным смещением, недавние вычислительные достижения достигли сборки почти полных геномов из составных SAG. [9] Данные, полученные от микроорганизмов, могут установить процессы культивирования в будущем. [10] Некоторые из инструментов сборки генома, используемых при секвенировании отдельных клеток, включают SPAdes , IDBA-UD, Cortex и HyDA. [11]
Опубликован список из более чем 100 различных методов одноклеточной омики. [ 12 ]
Множественная амплификация смещения (MDA) — широко используемая методика, позволяющая амплифицировать фемтограммы ДНК из бактерий до микрограммов для секвенирования. Реагенты, необходимые для реакций MDA, включают: случайные праймеры и ДНК-полимеразу из бактериофага phi29. В 30-градусной изотермической реакции ДНК амплифицируется с включенными реагентами. По мере того, как полимеразы производят новые нити, происходит реакция смещения нити, синтезирующая несколько копий с каждой матрицы ДНК. В то же время нити, которые были удлинены ранее, будут смещены. Продукты MDA дают длину около 12 кб и варьируются до около 100 кб, что позволяет использовать ее в секвенировании ДНК. [10] В 2017 году было введено значительное усовершенствование этой методики, названное WGA-X, за счет использования термостабильного мутанта полимеразы phi29, что приводит к лучшему восстановлению генома из отдельных клеток, в частности, с высоким содержанием G+C. [13] MDA также был реализован в микрофлюидной системе на основе капель для достижения высокопараллельной амплификации всего генома одной клетки. За счет инкапсуляции отдельных клеток в капли для захвата и амплификации ДНК этот метод обеспечивает снижение смещения и повышенную пропускную способность по сравнению с обычным MDA. [14]
Другим распространенным методом является MALBAC . [15] Как и в MDA, этот метод начинается с изотермической амплификации, но праймеры фланкируются «общей» последовательностью для последующей ПЦР-амплификации. По мере генерации предварительных ампликонов общая последовательность способствует самолигированию и образованию «петель» для предотвращения дальнейшей амплификации. В отличие от MDA, сильно разветвленная сеть ДНК не образуется. Вместо этого петли денатурируются в другом температурном цикле, что позволяет амплифицировать фрагменты с помощью ПЦР. MALBAC также был реализован в микрофлюидном устройстве, но производительность амплификации не была значительно улучшена при инкапсуляции в нанолитровых каплях. [16]
Сравнивая MDA и MALBAC, MDA обеспечивает лучшее покрытие генома, но MALBAC обеспечивает более равномерное покрытие по всему геному. MDA может быть более эффективным для идентификации SNP , тогда как MALBAC предпочтительнее для обнаружения вариантов числа копий. В то время как выполнение MDA с помощью микрофлюидного устройства заметно снижает смещение и загрязнение, химия, задействованная в MALBAC, не демонстрирует того же потенциала для повышения эффективности.
Метод, особенно подходящий для обнаружения структурных вариаций генома , — это секвенирование нити шаблона одноклеточной ДНК (Single-cell DNA matrix strand seq). [17] Используя принцип трехканальной обработки одноклеточной ДНК, который использует совместное моделирование ориентации считывания, глубины считывания и фазы гаплотипа, Strand-seq позволяет обнаруживать полный спектр классов соматических структурных вариаций размером ≥200 кб. Strand-seq преодолевает ограничения методов, основанных на амплификации всего генома, для идентификации классов соматических генетических вариаций в отдельных клетках, [18], поскольку он не восприимчив к химерам считывания, приводящим к вызову артефактов (подробно обсуждается в разделе ниже), и меньше подвержен выпадениям. Выбор метода зависит от цели секвенирования, поскольку каждый метод имеет различные преимущества. [7]
MDA отдельных клеточных геномов приводит к крайне неравномерному покрытию генома, т. е. относительному перепредставлению и недопредставлению различных регионов шаблона, что приводит к потере некоторых последовательностей. В этом процессе есть два компонента: a) стохастическая пере- и недоамплификация случайных регионов; и b) систематическое смещение против регионов с высоким %GC. Стохастический компонент может быть устранен путем объединения реакций MDA отдельных клеток из одного типа клеток, путем использования флуоресцентной гибридизации in situ (FISH) и/или подтверждения после секвенирования. [10] Смещение MDA против регионов с высоким %GC может быть устранено путем использования термостабильных полимераз, например, в процессе, называемом WGA-X. [13]
Однонуклеотидные полиморфизмы (SNP), которые являются большой частью генетической изменчивости в геноме человека , и вариация числа копий (CNV) создают проблемы при секвенировании отдельных клеток, а также ограниченное количество ДНК, извлеченной из отдельной клетки. Из-за скудного количества ДНК точный анализ ДНК создает проблемы даже после амплификации, поскольку покрытие низкое и подвержено ошибкам. При использовании MDA среднее покрытие генома составляет менее 80%, а SNP, которые не охвачены считываниями секвенирования, будут исключены. Кроме того, MDA показывает высокий коэффициент выпадения аллелей , не обнаруживая аллели из гетерозиготных образцов. В настоящее время используются различные алгоритмы SNP, но ни один из них не является специфичным для секвенирования отдельных клеток. MDA с CNV также создает проблему выявления ложных CNV, которые скрывают настоящие CNV. Чтобы решить эту проблему, когда шаблоны могут быть сгенерированы из ложных CNV, алгоритмы могут обнаружить и искоренить этот шум, чтобы произвести истинные варианты. [19]
Strand-seq преодолевает ограничения методов, основанных на полногеномной амплификации для распознавания генетических вариантов: поскольку Strand-seq не требует прочтений (или пар прочтений), пересекающих границы (или точки разрыва) CNV или классов структурных вариантов со сбалансированным копированием, он менее восприимчив к распространенным артефактам одноклеточных методов, основанных на полногеномной амплификации, которые включают выпадения распознавания вариантов из-за отсутствия прочтений в точке разрыва варианта и химерное прочтение. [7] [18] Strand-seq обнаруживает полный спектр классов структурных вариаций размером не менее 200 кб, включая циклы разрыв-слияние-мостик и события хромотрипсиса , а также сбалансированные инверсии и сбалансированные или несбалансированные по числу копий транслокации. [18] «Вызовы структурных вариантов, сделанные Strand-seq, разрешаются гаплотипом длины хромосомы , что обеспечивает дополнительную специфичность вызова вариантов. [18] В качестве текущего ограничения Strand-seq требует деления клеток для специфической для цепи маркировки с использованием бромдезоксиуридина (BrdU), и метод не обнаруживает варианты размером менее 200 кб, такие как вставки мобильных элементов .
Микробиомы являются одними из основных целей геномики отдельных клеток из-за сложности культивирования большинства микроорганизмов в большинстве сред. Геномика отдельных клеток является мощным способом получения последовательностей генома микроорганизмов без культивирования. Этот подход широко применяется к морским, почвенным, подземным, организменным и другим типам микробиомов для решения широкого круга вопросов, связанных с микробной экологией, эволюцией, общественным здравоохранением и потенциалом биотехнологий. [20] [21] [22] [23] [24] [25] [26] [27] [28]
Секвенирование рака также является новым применением scDNAseq. Свежие или замороженные опухоли могут быть проанализированы и классифицированы относительно SCNA, SNV и перестроек довольно хорошо с использованием подходов ДНК всего генома. [29] Рак scDNAseq особенно полезен для изучения глубины сложности и сложных мутаций, присутствующих в амплифицированных терапевтических мишенях, таких как гены рецепторной тирозинкиназы (EGFR, PDGFRA и т. д.), где обычные подходы на уровне популяции к объемной опухоли не способны разрешить паттерны совместного появления этих мутаций в отдельных клетках опухоли. Такое перекрытие может обеспечить избыточность активации пути и резистентности опухолевых клеток.
Секвенирование метилома ДНК отдельных клеток количественно определяет метилирование ДНК . Существует несколько известных типов метилирования, которые встречаются в природе, включая 5-метилцитозин (5mC), 5-гидроксиметилцитозин (5hmC), 6-метиладенозин (6mA) и 4-метилцитозин (4mC). У эукариот, особенно животных, 5mC широко распространен по геному и играет важную роль в регуляции экспрессии генов путем подавления мобильных элементов . [31] Секвенирование 5mC в отдельных клетках может показать, как эпигенетические изменения в генетически идентичных клетках из одной ткани или популяции приводят к появлению клеток с разными фенотипами.
Бисульфитное секвенирование стало золотым стандартом в обнаружении и секвенировании 5mC в отдельных клетках. [32] Обработка ДНК бисульфитом преобразует остатки цитозина в урацил, но оставляет остатки 5-метилцитозина незатронутыми. Поэтому ДНК, обработанная бисульфитом, сохраняет только метилированные цитозины. Чтобы получить считывание метилома, обработанная бисульфитом последовательность выравнивается с немодифицированным геномом. Бисульфитное секвенирование всего генома было достигнуто в отдельных клетках в 2014 году. [33] Метод преодолевает потерю ДНК, связанную с типичной процедурой, когда адаптеры секвенирования добавляются до фрагментации бисульфитом. Вместо этого адаптеры добавляются после обработки и фрагментации ДНК бисульфитом, что позволяет амплифицировать все фрагменты с помощью ПЦР. [34] Используя глубокое секвенирование, этот метод захватывает ~40% от общего количества CpG в каждой клетке. При существующих технологиях ДНК не может быть амплифицирована до обработки бисульфитом, поскольку метки 5mC не будут скопированы полимеразой.
Еще одним методом является бисульфитное секвенирование с пониженным представительством отдельных клеток (scRRBS). [35] Этот метод использует тенденцию метилированных цитозинов к кластеризации на CpG-островках (CGI) для обогащения областей генома с высоким содержанием CpG. Это снижает стоимость секвенирования по сравнению с бисульфитным секвенированием всего генома, но ограничивает охват этого метода. Когда RRBS применяется к объемным образцам, обнаруживается большинство сайтов CpG в промоторах генов, но сайты в промоторах генов составляют только 10% сайтов CpG во всем геноме. [36] В отдельных клетках обнаруживается 40% сайтов CpG из объемного образца. Для увеличения охвата этот метод также можно применять к небольшому пулу отдельных клеток. В образце из 20 объединенных отдельных клеток было обнаружено 63% сайтов CpG из объемного образца. Объединение отдельных клеток — одна из стратегий увеличения охвата метиломом, но за счет сокрытия гетерогенности популяции клеток.
Хотя бисульфитное секвенирование остается наиболее широко используемым подходом для обнаружения 5mC, химическая обработка является жесткой и фрагментирует и разрушает ДНК. Этот эффект усугубляется при переходе от объемных образцов к отдельным клеткам. Другие методы обнаружения метилирования ДНК включают чувствительные к метилированию рестриктазы. Рестриктазы также позволяют обнаруживать другие типы метилирования, такие как 6mA с DpnI . [37] Секвенирование на основе нанопор также предлагает путь для прямого секвенирования метилирования без фрагментации или модификации исходной ДНК. Секвенирование на нанопорах использовалось для секвенирования метиломов бактерий, в которых доминируют 6mA и 4mC (в отличие от 5mC у эукариот), но эта методика еще не была масштабирована до отдельных клеток. [38]
Секвенирование метилирования ДНК отдельных клеток широко использовалось для изучения эпигенетических различий в генетически схожих клетках. Для проверки этих методов в ходе их разработки данные метилома отдельных клеток смешанной популяции были успешно классифицированы с помощью иерархической кластеризации для идентификации различных типов клеток. [35] Другое применение — изучение отдельных клеток во время первых нескольких клеточных делений на ранней стадии развития, чтобы понять, как из одного эмбриона появляются различные типы клеток. [39] Бисульфитное секвенирование всего генома отдельных клеток также использовалось для изучения редких, но высокоактивных типов клеток при раке, таких как циркулирующие опухолевые клетки (ЦОК). [40]
Секвенирование хроматина, доступное для транспозазы одной клетки, отображает доступность хроматина по всему геному. Транспозаза вставляет адаптеры секвенирования непосредственно в открытые области хроматина, позволяя амплифицировать и секвенировать эти области. [41]
Два метода подготовки библиотеки в scATAC-Seq основаны на индексации клеток с разделением пула и микрофлюидике.
Стандартные методы, такие как микрочипы и bulk RNA-seq, анализируют экспрессию РНК из больших популяций клеток. Эти измерения могут скрывать критические различия между отдельными клетками в смешанных популяциях клеток. [42] [43]
Секвенирование РНК отдельных клеток (scRNA-seq) обеспечивает профили экспрессии отдельных клеток и считается золотым стандартом для определения состояний и фенотипов клеток по состоянию на 2020 год. [44] Хотя невозможно получить полную информацию о каждой РНК, экспрессируемой каждой клеткой, из-за небольшого количества доступного материала, паттерны экспрессии генов могут быть идентифицированы с помощью анализа кластеризации генов . [45] Это может раскрыть редкие типы клеток в популяции клеток, которые, возможно, никогда не встречались ранее. Например, одна группа ученых, проводивших scRNA-seq на опухолевой ткани нейробластомы, идентифицировала редкую раковую клетку паннейробластомы, которая может быть привлекательна для новых подходов к терапии. [46]
Текущие протоколы scRNA-seq включают изоляцию отдельных клеток и их РНК, а затем выполнение тех же шагов, что и для массового РНК-seq: обратная транскрипция (RT), амплификация, создание библиотеки и секвенирование. Ранние методы разделяли отдельные клетки в отдельные лунки; более поздние методы инкапсулировали отдельные клетки в капли в микрофлюидном устройстве, где происходит реакция обратной транскрипции, преобразующая РНК в кДНК. Каждая капля несет «штрихкод» ДНК, который уникально маркирует кДНК, полученные из одной клетки. После завершения обратной транскрипции кДНК из многих клеток можно смешивать для секвенирования, поскольку транскрипты из конкретной клетки идентифицируются по уникальному штрихкоду. [47] [48]
Проблемы scRNA-Seq включают сохранение исходного относительного количества мРНК в клетке и идентификацию редких транскриптов. [49] Этап обратной транскрипции имеет решающее значение, поскольку эффективность реакции ОТ определяет, какая часть популяции РНК клетки будет в конечном итоге проанализирована секвенатором. Процессивность обратных транскриптаз и используемые стратегии праймирования могут влиять на производство полноразмерной кДНК и создание библиотек, смещенных в сторону 3' или 5' конца генов.
На этапе амплификации в настоящее время для амплификации кДНК используется либо ПЦР, либо транскрипция in vitro (IVT). Одним из преимуществ методов на основе ПЦР является возможность генерировать полноразмерную кДНК. Однако различная эффективность ПЦР на определенных последовательностях (например, содержание GC и структура snapback) также может экспоненциально усиливаться, создавая библиотеки с неравномерным покрытием. С другой стороны, в то время как библиотеки, созданные с помощью IVT, могут избегать смещения последовательности, вызванного ПЦР, определенные последовательности могут транскрибироваться неэффективно, что приводит к выпадению последовательности или созданию неполных последовательностей. [1] [42] Было опубликовано несколько протоколов scRNA-seq: Tang et al., [50] STRT, [51] SMART-seq, [52] SORT-seq, [53] CEL-seq, [54] RAGE-seq, [55] Quartz-seq. [56] и C1-CAGE. [57] Эти протоколы различаются по стратегиям обратной транскрипции, синтеза и амплификации кДНК, а также по возможности использования штрихкодов, специфичных для последовательности (т. е. UMI ) или способности обрабатывать объединенные образцы. [58]
В 2017 году были представлены два подхода для одновременного измерения экспрессии мРНК и белка в отдельных клетках с помощью антител, меченых олигонуклеотидами, известных как REAP-seq, [59] и CITE-seq. [60] Сбор клеточного содержимого после электрофизиологической записи с использованием патч-клампа также позволил разработать метод Patch-Seq , который неуклонно набирает популярность в нейробиологии. [61]
Эта платформа секвенирования РНК отдельных клеток позволяет анализировать транскриптомы на основе клетки за клеткой с помощью микрофлюидного разделения для захвата отдельных клеток и подготовки библиотек кДНК для секвенирования следующего поколения (NGS) . [62] Платформа на основе капель позволяет проводить массовое параллельное секвенирование мРНК в большом количестве отдельных клеток путем захвата отдельной клетки в масляной капле. [63]
В целом, на первом этапе отдельные клетки захватываются по отдельности и лизируются, затем выполняется обратная транскрипция (ОТ) мРНК и получается библиотека кДНК . Для выбора мРНК ОТ выполняется с одноцепочечной последовательностью дезокситиминового (oligo dT) праймера , который специфически связывает поли(А) хвост молекул мРНК. Затем амплифицированная библиотека кДНК используется для секвенирования. [64]
Итак, первым шагом метода является инкапсуляция отдельной клетки и подготовка библиотеки. Клетки инкапсулируются в гелевые шарики в эмульсии (GEM) благодаря автомату. Для формирования этих пузырьков автомат использует микрофлюидный чип и объединяет все компоненты с маслом. Каждый функциональный GEM содержит одну клетку, одну гелевую шарик и реагенты ОТ. На гелевой шарике связываются олигнонуклеотиды, состоящие из 4 отдельных частей: праймер ПЦР (необходим для секвенирования); 10-кратные штрихкодированные олигонуклеотиды; последовательность уникального молекулярного идентификатора (UMI); последовательность PolydT (которая позволяет захватывать полиаденилированные молекулы мРНК). [65] Внутри каждой реакционной везикулы GEM одна клетка лизируется и подвергается обратной транскрипции. кДНК из одной и той же клетки идентифицируются благодаря общему 10-кратному штрихкоду. Кроме того, количество UMIs выражает уровень экспрессии гена, и его анализ позволяет обнаружить высоковариабельные гены. Эти данные часто используются либо для классификации клеточного фенотипа, либо для идентификации новой субпопуляции. [66]
Последним шагом платформы является секвенирование. Созданные библиотеки могут быть напрямую использованы для секвенирования всего транскриптома отдельной клетки или рабочих процессов целевого секвенирования. Секвенирование выполняется с использованием метода секвенирования красителя Illumina . Этот метод секвенирования основан на принципе секвенирования синтезом (SBS) и использовании обратимого терминатора красителя, который позволяет идентифицировать каждый отдельный нуклеотид. Для того чтобы прочитать последовательности транскриптов на одном конце, а штрих-код и UMI на другом конце, требуются считыватели парных конечных последовательностей. [67]
Платформа на основе капель позволяет обнаруживать редкие типы клеток благодаря своей высокой пропускной способности. Фактически, от 500 до 10 000 клеток захватываются на образец из одной клеточной суспензии. Протокол выполняется легко и обеспечивает высокую скорость восстановления клеток до 65%. Глобальный рабочий процесс платформы на основе капель занимает 8 часов и, таким образом, быстрее, чем метод на основе микролуночных лунок (BD Rhapsody), который занимает 10 часов. Однако он имеет некоторые ограничения, такие как необходимость в свежих образцах и окончательное обнаружение только 10% мРНК.
Основное различие между методом на основе капель и методом на основе микролунок заключается в технике, используемой для разделения клеток. [64]
Большинство методов РНК-секвенирования зависят от захвата поли(А)-хвоста для обогащения мРНК и истощения обильных и неинформативных рРНК. Таким образом, они часто ограничиваются секвенированием полиаденилированных молекул мРНК. Однако недавние исследования теперь начинают оценивать важность не-поли(А) РНК, таких как длинные некодирующие РНК и микроРНК в регуляции экспрессии генов. Small-seq — это метод одной клетки, который захватывает малые РНК (<300 нуклеотидов), такие как микроРНК, фрагменты тРНК и малые ядрышковые РНК в клетках млекопитающих. [68] Этот метод использует комбинацию «олигонуклеотидных масок» (которые ингибируют захват очень обильных молекул 5.8S рРНК) и выбор размера для исключения крупных видов РНК, таких как другие очень обильные молекулы рРНК. Для нацеливания на более крупные не-поли(А) РНК, такие как длинные некодирующие мРНК, гистоновые мРНК, кольцевые РНК и энхансерные РНК, выбор размера не применим для истощения высокораспространенных молекул рибосомальной РНК (18S и 28s рРНК). [69] Одноклеточный RamDA-Seq — это метод, который достигает этого путем выполнения обратной транскрипции со случайным праймированием (амплификацией случайного смещения) в присутствии «не столь случайных» (NSR) праймеров, специально разработанных для избежания праймирования молекулы рРНК. [70] Хотя этот метод успешно захватывает полноразмерные общие транскрипты РНК для секвенирования и обнаруживает множество не-поли(А) РНК с высокой чувствительностью, он имеет некоторые ограничения. Праймеры NSR были тщательно разработаны в соответствии с последовательностями рРНК в конкретном организме (мыши), и разработка новых наборов праймеров для других видов потребовала бы значительных усилий. Недавно основанный на CRISPR метод, названный scDASH (истощение отдельных клеток избыточных последовательностей путем гибридизации), продемонстрировал еще один подход к истощению последовательностей рРНК из библиотек тотальных РНК-секвенирований отдельных клеток. [71]
Бактерии и другие прокариоты в настоящее время не поддаются одноклеточному РНК-секвенированию из-за отсутствия полиаденилированной мРНК. Таким образом, разработка методов одноклеточного РНК-секвенирования, которые не зависят от захвата поли(А)-хвоста, также будет играть важную роль в обеспечении возможности проведения исследований микробиома с разрешением на уровне отдельных клеток. Массовые бактериальные исследования обычно применяют общее истощение рРНК для преодоления недостатка полиаденилированной мРНК у бактерий, но на уровне отдельных клеток общая РНК, обнаруженная в одной клетке, слишком мала. [69] Отсутствие полиаденилированной мРНК и дефицит общей РНК, обнаруженной в отдельных бактериальных клетках, являются двумя важными барьерами, ограничивающими применение scRNA-секвенирования в бактериях.
scRNA-Seq становится широко используемым в биологических дисциплинах , включая биологию развития , [72] неврологию , [73] онкологию , [74] [75] [76] иммунологию , [77] [78] сердечно-сосудистые исследования [79] [80] и инфекционные заболевания . [81] [82]
Используя методы машинного обучения , данные из bulk RNA-Seq были использованы для увеличения соотношения сигнал/шум в scRNA-Seq. В частности, ученые использовали профили экспрессии генов из наборов данных по всем видам рака для построения сетей коэкспрессии , а затем применили их к профилям экспрессии генов отдельных клеток, получив более надежный метод обнаружения наличия мутаций в отдельных клетках с использованием уровней транскриптов. [83]
Некоторые методы scRNA-seq также применялись к одноклеточным микроорганизмам. SMART-seq2 использовался для анализа одноклеточных эукариотических микробов, но поскольку он основан на захвате поли(А)-хвоста, он не применялся к прокариотическим клеткам. [84] Микрофлюидные подходы, такие как Drop-seq и устройства Fluidigm IFC-C1, использовались для секвенирования отдельных малярийных паразитов или отдельных дрожжевых клеток. [85] [86] Исследование одноклеточных дрожжей ставило целью охарактеризовать гетерогенную стрессоустойчивость в изогенных дрожжевых клетках до и после того, как дрожжи подвергаются солевому стрессу. Анализ отдельных клеток нескольких факторов транскрипции с помощью scRNA-seq выявил гетерогенность в популяции. Эти результаты свидетельствуют о том, что регуляция различается среди членов популяции, что увеличивает шансы на выживание для части популяции.
Первый анализ транскриптома отдельной клетки у прокариотических видов был выполнен с использованием фермента терминаторной экзонуклеазы для селективной деградации рРНК и амплификации катящегося кольца (RCA) мРНК. [87] В этом методе концы одноцепочечной ДНК были лигированы вместе, чтобы сформировать кольцо, а полученная петля затем использовалась в качестве шаблона для линейной амплификации РНК. Затем конечная библиотека продуктов была проанализирована с помощью микрочипа с низким смещением и хорошим покрытием. Однако RCA не был протестирован с РНК-секвенированием, которое обычно использует секвенирование следующего поколения. РНК-секвенирование отдельной клетки для бактерий было бы очень полезно для изучения микробиомов. Оно решило бы проблемы, возникающие в традиционных подходах к массовой метатранскриптомике, такие как невозможность захвата видов, присутствующих в низкой численности, и невозможность разрешения гетерогенности среди популяций клеток.
scRNA-Seq предоставил значительную информацию о развитии эмбрионов и организмов, включая червя Caenorhabditis elegans [88] и регенеративную планарию Schmidtea mediterranea [89] [90] и аксолотля Ambystoma mexicanum [91] [92] Первыми позвоночными животными, которые были картированы таким образом, были данио-рерио [93] [94] [95] и Xenopus laevis [96] В каждом случае изучались множественные стадии эмбриона, что позволило картировать весь процесс развития на основе клетка за клеткой. Наука признала эти достижения Прорывом года 2018 [97 ]
Был создан молекулярный атлас клеток яичек мышей для определения препубертальной токсичности яичек, вызванной BDE47, с использованием подхода ScRNA-seq, что обеспечивает новое понимание основных механизмов и путей, вовлеченных в повреждение яичек, связанное с BDE47, на уровне одной клетки. [98]
Существует несколько способов выделения отдельных клеток перед амплификацией и секвенированием всего генома. Широко используется метод сортировки клеток с активацией флуоресценции (FACS). Отдельные клетки также можно собирать с помощью микроманипуляций, например, путем серийного разбавления или с помощью пипетки-патча или нанотрубки для сбора одной клетки. [15] [99] Преимущества микроманипуляций — простота и низкая стоимость, но они трудоемки и подвержены неправильной идентификации типов клеток под микроскопом. Лазерная микродиссекция с захватом (LCM) также может использоваться для сбора отдельных клеток. Хотя LCM сохраняет информацию о пространственном расположении отобранной клетки в ткани, сложно захватить целую отдельную клетку, не собрав также материалы из соседних клеток. [42] [100] [101] Высокопроизводительные методы выделения отдельных клеток также включают микрофлюидику . Как FACS, так и микрофлюидика являются точными, автоматическими и способны изолировать беспристрастные образцы. Однако оба метода требуют предварительного отделения клеток от их микроокружения, что приводит к нарушению транскрипционных профилей при анализе экспрессии РНК. [102] [103]
Протоколы РНК-Seq для отдельных клеток различаются по эффективности захвата РНК, что приводит к различиям в количестве транскриптов, полученных от каждой отдельной клетки. Библиотеки отдельных клеток обычно секвенируются на глубину 1 000 000 прочтений, поскольку подавляющее большинство генов обнаруживается при 500 000 прочтений. [104] Увеличение количества клеток и уменьшение глубины прочтения увеличивает способность идентификации основных популяций клеток. Однако низкая глубина прочтения не всегда может предоставить необходимую информацию о генах, а разница в их экспрессии между популяциями клеток зависит от стабильности и обнаружения молекул мРНК.
Ковариаты контроля качества служат стратегией для анализа количества клеток. Эти ковариаты в основном включают фильтрацию на основе глубины подсчета, количества генов и доли подсчетов от митохондриальных генов, что приводит к интерпретации клеточных сигналов.