Коллекция микроскопических пятен ДНК, прикрепленных к твердой поверхности
ДНК -микрочип (также известный как ДНК- чип или биочип ) представляет собой набор микроскопических пятен ДНК, прикрепленных к твердой поверхности. Ученые используют ДНК- микрочипы для одновременного измерения уровней экспрессии большого количества генов или для генотипирования нескольких областей генома. Каждое пятно ДНК содержит пикомоли (10−12 моль ) определенной последовательности ДНК, известной как зонды (или репортеры , или олигонуклеотиды ). Это может быть короткий участок гена или другого элемента ДНК, который используется для гибридизации образца кДНК или кРНК (также называемого антисмысловой РНК) (называемого мишенью ) в условиях высокой строгости. Гибридизация зонд-мишень обычно обнаруживается и количественно определяется путем обнаружения меченых флуорофором , серебром или хемилюминесцентным методом мишеней для определения относительного содержания последовательностей нуклеиновых кислот в мишени. Первоначальные массивы нуклеиновых кислот представляли собой макромассивы размером примерно 9 см × 12 см, а первый компьютерный анализ на основе изображений был опубликован в 1981 году. [1] Он был изобретен Патриком О. Брауном . Примером его применения являются массивы SNP для полиморфизмов при сердечно-сосудистых заболеваниях, раке, патогенах и анализ GWAS. Он также используется для идентификации структурных вариаций и измерения экспрессии генов.
Принцип
Основным принципом микрочипов является гибридизация между двумя цепями ДНК, свойство комплементарных последовательностей нуклеиновых кислот специфически спариваться друг с другом путем образования водородных связей между комплементарными парами нуклеотидных оснований . Большое количество комплементарных пар оснований в нуклеотидной последовательности означает более тесную нековалентную связь между двумя цепями. После смывания неспецифических связывающих последовательностей гибридизированными останутся только сильно спаренные цепи. Флуоресцентно меченые целевые последовательности, которые связываются с последовательностью зонда, генерируют сигнал, который зависит от условий гибридизации (таких как температура) и промывки после гибридизации. Общая сила сигнала от пятна (признака) зависит от количества целевого образца, связывающегося с зондами, присутствующими на этом пятне. Микрочипы используют относительное количественное определение, при котором интенсивность признака сравнивается с интенсивностью того же признака в других условиях, а идентичность признака известна по его положению.
Виды и виды
Существует множество типов массивов, и самое общее различие заключается в том, расположены ли они пространственно на поверхности или на кодированных бусинах:
Традиционный массив твердой фазы представляет собой набор упорядоченных микроскопических «пятен», называемых элементами, каждый из которых имеет тысячи идентичных и специфических зондов, прикрепленных к твердой поверхности, такой как стеклянный , пластиковый или кремниевый биочип (обычно известный как геномный чип , ДНК-чип или генный массив ). Тысячи этих элементов могут быть размещены в известных местах на одном ДНК-микрочипе.
Альтернативный массив бусин представляет собой набор микроскопических полистирольных бусин, каждая из которых имеет определенный зонд и соотношение двух или более красителей, которые не мешают флуоресцентным красителям, используемым в целевой последовательности.
Специализированные массивы, предназначенные для конкретных культур , становятся все более популярными в молекулярно-селекционных приложениях. В будущем их можно будет использовать для скрининга саженцев на ранних стадиях, чтобы снизить количество ненужных саженцев, опробованных в селекционных операциях. [10]
Изготовление
Микрочипы могут быть изготовлены разными способами, в зависимости от количества исследуемых зондов, стоимости, требований к настройке и типа задаваемого научного вопроса. Массивы от коммерческих поставщиков могут иметь всего 10 зондов или до 5 миллионов или более зондов микрометрового масштаба.
Пятнистый против.на местесинтезированные массивы
Микрочипы могут быть изготовлены с использованием различных технологий, включая печать с помощью остроконечных штифтов на стеклянных предметных стеклах, фотолитографию с использованием готовых масок, фотолитографию с использованием динамических микрозеркальных устройств, струйную печать [11] [12] или электрохимию на микроэлектродных матрицах.
В точечных микроматрицах зонды представляют собой олигонуклеотиды , кДНК или небольшие фрагменты продуктов ПЦР , которые соответствуют мРНК . Зонды синтезируются до нанесения на поверхность матрицы, а затем «наносятся» на стекло. Обычный подход заключается в использовании массива тонких булавок или игл, управляемых роботизированной рукой, которая погружается в лунки, содержащие ДНК-зонды, а затем наносится каждый зонд в назначенные места на поверхности матрицы. Полученная «сетка» зондов представляет собой профили нуклеиновых кислот подготовленных зондов и готова к приему дополнительных «мишеней» кДНК или кРНК, полученных из экспериментальных или клинических образцов. Этот метод используется учеными-исследователями по всему миру для производства «внутренних» печатных микроматриц в их собственных лабораториях. Эти матрицы можно легко настраивать для каждого эксперимента, поскольку исследователи могут выбирать зонды и места печати на матрицах, синтезировать зонды в своей собственной лаборатории (или сотрудничающем учреждении) и наносить на матрицы. Затем они могут генерировать собственные маркированные образцы для гибридизации, гибридизировать образцы с массивом и, наконец, сканировать массивы с помощью собственного оборудования. Это обеспечивает относительно недорогой микромассив, который может быть настроен для каждого исследования, и позволяет избежать расходов на покупку часто более дорогих коммерческих массивов, которые могут представлять огромное количество генов, не представляющих интереса для исследователя. Существуют публикации, которые указывают, что микромассивы с пятнами, изготовленные в домашних условиях, могут не обеспечивать тот же уровень чувствительности по сравнению с коммерческими массивами олигонуклеотидов [13] , возможно, из-за небольших размеров партии и сниженной эффективности печати по сравнению с промышленным производством олигомассивов.
В олигонуклеотидных микроматрицах зонды представляют собой короткие последовательности, разработанные для сопоставления частей последовательности известных или предсказанных открытых рамок считывания . Хотя олигонуклеотидные зонды часто используются в «точечных» микроматрицах, термин «олигонуклеотидная матрица» чаще всего относится к определенной технике изготовления. Олигонуклеотидные матрицы производятся путем печати коротких олигонуклеотидных последовательностей, разработанных для представления одного гена или семейства вариантов сплайсинга генов, путем синтеза этой последовательности непосредственно на поверхности матрицы вместо нанесения целых последовательностей. Последовательности могут быть длиннее (60-мерные зонды, такие как конструкция Agilent ) или короче (25-мерные зонды, производимые Affymetrix ) в зависимости от желаемой цели; более длинные зонды более специфичны для отдельных целевых генов, более короткие зонды могут быть размещены с большей плотностью по всей матрице и их производство дешевле. Одна из методик, используемых для производства массивов олигонуклеотидов, включает фотолитографический синтез (Affymetrix) на кремниевой подложке, где свет и светочувствительные маскирующие агенты используются для «построения» последовательности по одному нуклеотиду за раз по всему массиву. [14] Каждый применимый зонд выборочно «демаскируется» перед погружением массива в раствор одного нуклеотида, затем происходит реакция маскирования, и следующий набор зондов демаскируется для подготовки к другому воздействию нуклеотида. После множества повторений последовательности каждого зонда становятся полностью построенными. Совсем недавно Maskless Array Synthesis от NimbleGen Systems объединил гибкость с большим количеством зондов. [15]
Двухканальное и одноканальное обнаружение
Двухцветные микрочипы или двухканальные микрочипы обычно гибридизуются с кДНК, приготовленной из двух образцов для сравнения (например, больная ткань против здоровой ткани) и помеченной двумя разными флуорофорами . [16] Флуоресцентные красители, обычно используемые для маркировки кДНК, включают Cy 3, который имеет длину волны флуоресценции 570 нм (соответствует зеленой части светового спектра), и Cy 5 с длиной волны флуоресценции 670 нм (соответствует красной части светового спектра). Два образца кДНК, помеченных Cy, смешиваются и гибридизуются в один микрочип, который затем сканируется в сканере микрочипов для визуализации флуоресценции двух флуорофоров после возбуждения лазерным лучом определенной длины волны. Относительные интенсивности каждого флуорофора затем могут быть использованы в анализе на основе соотношений для идентификации генов с повышенной и пониженной регуляцией. [17]
Олигонуклеотидные микрочипы часто несут контрольные зонды, предназначенные для гибридизации с РНК-вставками . Степень гибридизации между вставками и контрольными зондами используется для нормализации измерений гибридизации для целевых зондов. Хотя абсолютные уровни экспрессии генов могут быть определены в двухцветном массиве в редких случаях, относительные различия в экспрессии между различными точками в образце и между образцами являются предпочтительным методом анализа данных для двухцветной системы. Примерами поставщиков таких микрочипов являются Agilent с их платформой Dual-Mode, Eppendorf с их платформой DualChip для колориметрической маркировки Silverquant и TeleChem International с Arrayit.
В одноканальных микрочипах или одноцветных микрочипах массивы предоставляют данные об интенсивности для каждого зонда или набора зондов, указывающие на относительный уровень гибридизации с меченой целью. Однако они не указывают на истинные уровни распространенности гена, а скорее на относительную распространенность по сравнению с другими образцами или условиями при обработке в том же эксперименте. Каждая молекула РНК сталкивается с протокольным и специфичным для партии смещением во время фаз амплификации, маркировки и гибридизации эксперимента, что делает сравнения между генами для одного и того же микрочипа неинформативными. Сравнение двух условий для одного и того же гена требует двух отдельных гибридизаций с одним красителем. Несколько популярных одноканальных систем — это Affymetrix «Gene Chip», Illumina «Bead Chip», одноканальные массивы Agilent, массивы Applied Microarrays «CodeLink» и Eppendorf «DualChip & Silverquant». Одно из преимуществ одноцветной системы заключается в том, что аберрантный образец не может повлиять на необработанные данные, полученные из других образцов, поскольку каждый чип массива подвергается воздействию только одного образца (в отличие от двухцветной системы, в которой один образец низкого качества может существенно повлиять на общую точность данных, даже если другой образец был высокого качества). Другое преимущество заключается в том, что данные легче сравнивать с массивами из разных экспериментов, если учтены эффекты партии.
В некоторых ситуациях одноканальный микрочип может быть единственным выбором. Предположим, что необходимо сравнить образцы: тогда количество экспериментов, требуемых с использованием двухканальных массивов, быстро становится невыполнимым, если только образец не используется в качестве эталона.
Типичный протокол
Это пример эксперимента с ДНК-микрочипом , который включает детали для конкретного случая, чтобы лучше объяснить эксперименты с ДНК-микрочипом, а также перечисляет модификации для РНК или других альтернативных экспериментов.
Выращиваются/приобретаются два образца для сравнения (попарное сравнение). В этом примере обработанный образец ( случай ) и необработанный образец ( контроль ).
Очищенная РНК анализируется на качество ( капиллярным электрофорезом ) и количество (например, с помощью спектрометра NanoDrop или NanoPhotometer ). Если материал приемлемого качества и присутствует в достаточном количестве (например, >1 мкг , хотя необходимое количество варьируется в зависимости от платформы микрочипа), эксперимент может быть продолжен.
Маркированный продукт генерируется посредством обратной транскрипции с последующей необязательной амплификацией ПЦР . РНК подвергается обратной транскрипции либо с помощью праймеров polyT (которые амплифицируют только мРНК ), либо с помощью случайных праймеров (которые амплифицируют всю РНК, большую часть которой составляет рРНК ). Микрочипы miRNA лигируют олигонуклеотид с очищенной малой РНК (выделенной с помощью фракционатора), которая затем подвергается обратной транскрипции и амплификации.
Метка добавляется либо во время этапа обратной транскрипции, либо после амплификации, если она выполняется. Смысловая маркировка зависит от микрочипа; например, если метка добавляется со смесью ОТ, кДНК является антисмысловой, а зонд микрочипа — смысловой, за исключением случаев отрицательных контролей.
Маркировка может быть прямой (не используется ) или косвенной (требуется стадия связывания). Для двухканальных массивов стадия связывания происходит до гибридизации с использованием аминоаллилуридинтрифосфата ( аминоаллил-UTP или aaUTP) и аминореактивных красителей NHS (таких как цианиновые красители ); для одноканальных массивов стадия связывания происходит после гибридизации с использованием биотина и меченого стрептавидина . Модифицированные нуклеотиды (обычно в соотношении 1 aaUTP: 4 TTP ( тимидинтрифосфат )) добавляются ферментативно в низком соотношении к обычным нуклеотидам, что обычно приводит к 1 на каждые 60 оснований. Затем aaDNA очищается с помощью колонки (с использованием фосфатного буферного раствора, поскольку Tris содержит аминогруппы). Аминоаллильная группа представляет собой аминогруппу на длинном линкере, прикрепленном к нуклеиновому основанию, которое реагирует с реактивным красителем.
Форма репликации, известная как переворот красителя, может быть выполнена для контроля артефактов красителя в двухканальных экспериментах; для переворота красителя используется второй слайд с переставленными метками (образец, который был помечен Cy3 на первом слайде, помечен Cy5, и наоборот). В этом примере аминоаллил -UTP присутствует в обратно-транскрибированной смеси.
Затем маркированные образцы смешивают с фирменным гибридизационным раствором, который может состоять из SDS , SSC , декстрансульфата , блокирующего агента (например, ДНК Cot-1 , ДНК спермы лосося, ДНК тимуса теленка, PolyA или PolyT), раствора Денхардта или формамина .
Смесь денатурируется и добавляется в отверстия микроматрицы. Отверстия запечатываются, а микроматрица гибридизуется либо в гибридной печи, где микроматрица перемешивается вращением, либо в смесителе, где микроматрица перемешивается переменным давлением в отверстиях.
После гибридизации в течение ночи все неспецифические связи смываются (SDS и SSC).
Микрочип высушивается и сканируется с помощью машины, которая использует лазер для возбуждения красителя и измеряет уровни излучения с помощью детектора.
Изображение разбивается на сетку с помощью шаблона, и интенсивность каждого элемента (состоящего из нескольких пикселей) количественно оценивается.
Необработанные данные нормализуются; простейший метод нормализации заключается в вычитании фоновой интенсивности и масштабировании так, чтобы общие интенсивности признаков двух каналов были равны, или в использовании интенсивности референтного гена для расчета t-значения для всех интенсивностей. Более сложные методы включают z-ratio , регрессию loess и lowess и RMA (надежный многочиповый анализ) для чипов Affymetrix (одноканальный, кремниевый чип, короткие олигонуклеотиды, синтезированные in situ ).
Микрочипы и биоинформатика
Появление недорогих экспериментов с микрочипами создало несколько конкретных проблем биоинформатики: [19] множественные уровни репликации в экспериментальном дизайне (экспериментальный дизайн); количество платформ и независимых групп, а также формат данных (стандартизация); статистическая обработка данных (анализ данных); сопоставление каждого зонда с транскриптом мРНК , который он измеряет (аннотация); огромный объем данных и возможность их совместного использования (хранилище данных).
Экспериментальный дизайн
Ввиду биологической сложности экспрессии генов соображения относительно экспериментального дизайна, которые обсуждаются в статье о профилировании экспрессии, имеют решающее значение, если на основе полученных данных необходимо сделать статистически и биологически обоснованные выводы.
При планировании эксперимента с микрочипом необходимо учитывать три основных элемента. Во-первых, репликация биологических образцов необходима для вывода выводов из эксперимента. Во-вторых, технические повторы (например, два образца РНК, полученные из каждой экспериментальной единицы) могут помочь количественно оценить точность. Биологические повторы включают независимые экстракции РНК. Технические повторы могут быть двумя аликвотами одной и той же экстракции. В-третьих, пятна каждого клона кДНК или олигонуклеотида присутствуют в качестве повторов (по крайней мере, дубликатов) на предметном стекле микрочипа, чтобы обеспечить меру технической точности в каждой гибридизации. Крайне важно обсудить информацию о подготовке и обработке образцов, чтобы помочь идентифицировать независимые единицы в эксперименте и избежать завышенных оценок статистической значимости . [20]
Стандартизация
Данные микрочипов трудно обменивать из-за отсутствия стандартизации в производстве платформ, протоколах анализов и методах анализа. Это представляет собой проблему совместимости в биоинформатике . Различные низовые проекты с открытым исходным кодом пытаются облегчить обмен и анализ данных, полученных с помощью непатентованных чипов:
Например, контрольный список «Минимальная информация об эксперименте с микрочипами» ( MIAME ) помогает определить уровень детализации, который должен существовать, и принимается многими журналами в качестве требования для подачи статей, включающих результаты микрочипов. Но MIAME не описывает формат информации, поэтому, хотя многие форматы могут поддерживать требования MIAME, по состоянию на 2007 год [обновлять]ни один формат не допускает проверку полного семантического соответствия. Проект «Контроль качества микрочипов (MAQC)» проводится Управлением по контролю за продуктами питания и лекарственными средствами США (FDA) для разработки стандартов и метрик контроля качества, которые в конечном итоге позволят использовать данные микрочипов при разработке лекарств, клинической практике и принятии нормативных решений. [21] Общество MGED разработало стандарты для представления результатов экспериментов по экспрессии генов и соответствующих аннотаций.
Анализ данных
Наборы данных микрочипов обычно очень большие, и аналитическая точность зависит от ряда переменных. Статистические проблемы включают учет эффектов фонового шума и соответствующую нормализацию данных. Методы нормализации могут подходить для конкретных платформ, а в случае коммерческих платформ анализ может быть запатентованным. [22] Алгоритмы, которые влияют на статистический анализ, включают:
Анализ изображений: построение сетки, точечное распознавание сканированного изображения (алгоритм сегментации), удаление или маркировка некачественных и малоинтенсивных объектов (так называемая маркировка ).
Обработка данных: вычитание фона (на основе глобального или локального фона), определение интенсивности пятен и соотношений интенсивностей, визуализация данных (например, см. график MA ), логарифмическое преобразование соотношений, глобальная или локальная нормализация соотношений интенсивностей и сегментация на различные регионы числа копий с использованием алгоритмов обнаружения шагов . [23]
Анализ обнаружения классов: Этот аналитический подход, иногда называемый неконтролируемой классификацией или обнаружением знаний, пытается определить, объединяются ли микромассивы (объекты, пациенты, мыши и т. д.) или гены в группы. Выявление естественно существующих групп объектов (микромассивов или генов), которые объединяются вместе, может позволить обнаружить новые группы, которые ранее не были известны. Во время анализа обнаружения знаний различные неконтролируемые методы классификации могут использоваться с данными микромассивов ДНК для идентификации новых кластеров (классов) массивов. [24] Этот тип подхода не основан на гипотезах, а скорее основан на итеративном распознавании образов или статистических методах обучения для поиска «оптимального» количества кластеров в данных. Примерами методов неконтролируемого анализа являются самоорганизующиеся карты, нейронный газ, кластерный анализ k-средних, [25] иерархический кластерный анализ, кластеризация на основе обработки геномных сигналов и кластерный анализ на основе моделей. Для некоторых из этих методов пользователь также должен определить меру расстояния между парами объектов. Хотя обычно используется коэффициент корреляции Пирсона, в литературе были предложены и оценены несколько других мер. [26] Входные данные, используемые в анализах обнаружения классов, обычно основаны на списках генов, имеющих высокую информативность (низкий шум) на основе низких значений коэффициента вариации или высоких значений энтропии Шеннона и т. д. Определение наиболее вероятного или оптимального числа кластеров, полученных в результате неконтролируемого анализа, называется валидностью кластера. Некоторые часто используемые метрики для валидности кластера — это индекс силуэта, индекс Дэвиса-Боулдина, [27] индекс Данна или статистика Хьюберта .
Анализ предсказания класса: этот подход, называемый контролируемой классификацией, устанавливает основу для разработки предсказательной модели, в которую могут быть введены будущие неизвестные тестовые объекты для прогнозирования наиболее вероятной принадлежности к классу тестовых объектов. Контролируемый анализ [24] для прогнозирования класса включает использование таких методов, как линейная регрессия, k-ближайший сосед, квантование обучающего вектора, анализ дерева решений, случайные леса, наивный байесовский алгоритм, логистическая регрессия, ядерная регрессия, искусственные нейронные сети, машины опорных векторов, смесь экспертов и контролируемый нейронный газ. Кроме того, используются различные метаэвристические методы, такие как генетические алгоритмы , самоадаптация ковариационной матрицы, оптимизация роя частиц и оптимизация колонии муравьев . Входные данные для прогнозирования класса обычно основаны на отфильтрованных списках генов, которые предсказывают класс, определяемых с помощью классических тестов гипотез (следующий раздел), индекса разнообразия Джини или прироста информации (энтропии).
Статистический анализ на основе гипотез: выявление статистически значимых изменений в экспрессии генов обычно осуществляется с помощью t-теста , ANOVA , байесовского метода [28], методов теста Манна-Уитни , адаптированных к наборам данных микрочипов, которые учитывают множественные сравнения [29] или кластерный анализ . [30] Эти методы оценивают статистическую мощность на основе вариации, присутствующей в данных, и количества экспериментальных повторов и могут помочь минимизировать ошибки типа I и типа II в анализах. [31]
Уменьшение размерности: Аналитики часто уменьшают количество измерений (генов) перед анализом данных. [24] Это может включать линейные подходы, такие как анализ главных компонент (PCA) или нелинейное обучение многообразию (обучение на основе метрики расстояния) с использованием ядерного PCA, диффузионных карт, собственных карт Лапласа, локального линейного вложения, локально сохраняющих проекций и отображения Сэммона.
Методы на основе сетей: статистические методы, которые учитывают базовую структуру генных сетей, представляя либо ассоциативные, либо причинные взаимодействия или зависимости между продуктами генов. [32] Анализ сетей взвешенной коэкспрессии генов широко используется для идентификации модулей коэкспрессии и генов внутримодульных концентраторов. Модули могут соответствовать типам клеток или путям. Высокосвязанные внутримодульные концентраторы наилучшим образом представляют свои соответствующие модули.
Данные микрочипов могут потребовать дальнейшей обработки, направленной на уменьшение размерности данных для облегчения понимания и более целенаправленного анализа. [33] Другие методы позволяют анализировать данные, состоящие из небольшого числа биологических или технических повторов ; например, тест локальной объединенной ошибки (LPE) объединяет стандартные отклонения генов с аналогичными уровнями экспрессии в попытке компенсировать недостаточную репликацию. [34]
Аннотация
Связь между зондом и мРНК , которую он должен обнаружить, нетривиальна. [35] Некоторые мРНК могут перекрестно гибридизировать зонды в массиве, которые должны обнаружить другую мРНК. Кроме того, мРНК могут испытывать смещение амплификации, которое является специфичным для последовательности или молекулы. В-третьих, зонды, предназначенные для обнаружения мРНК определенного гена, могут полагаться на геномную информацию EST , которая неправильно связана с этим геном.
Хранилище данных
Данные микрочипов оказались более полезными по сравнению с другими подобными наборами данных. Огромный объем данных, специализированные форматы (например, MIAME ) и усилия по курированию, связанные с наборами данных, требуют специализированных баз данных для хранения данных. Ряд решений для хранения данных с открытым исходным кодом, таких как InterMine и BioMart , были созданы специально для интеграции разнообразных биологических наборов данных, а также для поддержки анализа.
Альтернативные технологии
Достижения в области массового параллельного секвенирования привели к разработке технологии RNA-Seq , которая позволяет использовать метод дробовика для всего транскриптома, чтобы характеризовать и количественно оценить экспрессию генов. [36] [37] В отличие от микрочипов, которым необходимо наличие референсного генома и транскриптома до того, как будет разработан сам микрочип, RNA-Seq можно использовать и для новых модельных организмов, геном которых еще не секвенирован. [37]
Глоссарий
Массив или слайд представляет собой набор объектов, пространственно организованных в двумерную сетку, организованную в столбцы и строки.
Блок или подмассив : группа пятен, обычно изготавливаемых за один цикл печати; несколько подмассивов/блоков образуют массив.
Случай/контроль : парадигма экспериментального дизайна, особенно подходящая для системы двухцветной матрицы, в которой условие, выбранное в качестве контроля (например, здоровая ткань или состояние), сравнивается с измененным состоянием (например, больная ткань или состояние).
Переключение красителей , или замена красителей , или обращение флуоресцентного сигнала : взаимная маркировка ДНК-мишеней двумя красителями для учета смещения красителя в экспериментах.
Сканер : прибор, используемый для обнаружения и количественной оценки интенсивности флуоресценции пятен на предметном стекле микрочипа путем избирательного возбуждения флуорофоров лазером и измерения флуоресценции с помощью системы фотоумножителей с фильтром (оптикой) .
Пятно или особенность : небольшая область на предметном стекле, содержащая пикомоли определенных образцов ДНК.
^ Тауб, Флойд (1983). «Лабораторные методы: Последовательные сравнительные гибридизации, проанализированные с помощью компьютерной обработки изображений, могут идентифицировать и количественно определять регулируемые РНК». ДНК . 2 (4): 309–327. doi :10.1089/dna.1983.2.309. PMID 6198132.
^ Adomas A; Heller G; Olson A; Osborne J; Karlsson M; Nahalkova J; Van Zyl L; Sederoff R; Stenlid J; Finlay R; Asiegbu FO (2008). «Сравнительный анализ обилия транскриптов в Pinus sylvestris после заражения сапротрофным, патогенным или мутуалистическим грибком». Tree Physiol . 28 (6): 885–897. doi :10.1093/treephys/28.6.885. PMID 18381269.
^ Pollack JR; Perou CM; Alizadeh AA; Eisen MB; Pergamenshchikov A; Williams CF; Jeffrey SS; Botstein D; Brown PO (1999). «Геномный анализ изменений числа копий ДНК с использованием микрочипов кДНК». Nat Genet . 23 (1): 41–46. doi :10.1038/12640. PMID 10471496. S2CID 997032.
^ Moran G; Stokes C; Thewes S; Hube B; Coleman DC; Sullivan D (2004). «Сравнительная геномика с использованием микрочипов ДНК Candida albicans выявляет отсутствие и расхождение генов, связанных с вирулентностью, у Candida dubliniensis». Микробиология . 150 (Pt 10): 3363–3382. doi : 10.1099/mic.0.27221-0 . hdl : 2262/6097 . PMID 15470115.
^ Hacia JG; Fan JB; Ryder O; Jin L; Edgemon K; Ghandour G; Mayer RA; Sun B; Hsie L; Robbins CM; Brody LC; Wang D; Lander ES; Lipshutz R; Fodor SP; Collins FS (1999). «Определение предковых аллелей для полиморфизмов одного нуклеотида человека с использованием массивов олигонуклеотидов высокой плотности». Nat Genet . 22 (2): 164–167. doi :10.1038/9674. PMID 10369258. S2CID 41718227.
^ abc Gagna, Claude E.; Lambert, W. Clark (1 мая 2009 г.). «Новые многоцепочечные, альтернативные, плазмидные и спиральные переходные ДНК и РНК микрочипы: значение для терапии». Pharmacogenomics . 10 (5): 895–914. doi :10.2217/pgs.09.27. ISSN 1744-8042. PMID 19450135.
^ abc Gagna, Claude E.; Clark Lambert, W. (1 марта 2007 г.). «Клеточная биология, хемогеномика и хемопротеомика – применение в разработке лекарств». Мнение экспертов по разработке лекарств . 2 (3): 381–401. doi :10.1517/17460441.2.3.381. ISSN 1746-0441. PMID 23484648. S2CID 41959328.
^ Мукерджи, Анирбан; Васкес, Карен М. (1 августа 2011 г.). «Триплексная технология в исследованиях повреждений ДНК, репарации ДНК и мутагенеза». Biochimie . 93 (8): 1197–1208. doi :10.1016/j.biochi.2011.04.001. ISSN 1638-6183. PMC 3545518 . PMID 21501652.
^ Rhodes, Daniela; Lipps, Hans J. (15 октября 2015 г.). «G-квадруплексы и их регуляторные роли в биологии». Nucleic Acids Research . 43 (18): 8627–8637. doi :10.1093/nar/gkv862. ISSN 1362-4962. PMC 4605312. PMID 26350216 .
^ Рашид, Авайс; Хао, Юаньфэн; Ся, Сяньчунь; Хан, Авайс; Сюй, Юньби; Варшни, Раджив К.; Хэ, Чжунху (2017). «Чипы для селекции сельскохозяйственных культур и платформы генотипирования: прогресс, проблемы и перспективы» (PDF) . Molecular Plant . 10 (8). Chin Acad Sci + Chin Soc Plant Bio + Shanghai Inst Bio Sci ( Elsevier ): 1047–1064. doi : 10.1016/j.molp.2017.06.008 . ISSN 1674-2052. PMID 28669791. S2CID 33780984.
^ J Biochem Biophys Methods. 2000 16 марта;42(3):105–10. ДНК-печать: использование стандартного струйного принтера для переноса нуклеиновых кислот на твердые носители. Goldmann T, Gonzalez JS.
^ Лаустед К. и др. (2004). «POSaM: быстрый, гибкий, с открытым исходным кодом, струйный олигонуклеотидный синтезатор и микрочип». Genome Biology . 5 (8): R58. doi : 10.1186 /gb-2004-5-8-r58 . PMC 507883. PMID 15287980.
^ Bammler T, Beyer RP; Консорциум, члены Toxicogenomics Research; Kerr, X; Jing, LX; Lapidus, S; Lasarev, DA; Paules, RS; Li, JL; Phillips, SO (2005). «Стандартизация глобального анализа экспрессии генов между лабораториями и между платформами». Nat Methods . 2 (5): 351–356. doi :10.1038/nmeth754. PMID 15846362. S2CID 195368323.
^ Nuwaysir EF; Huang W; Albert TJ; Singh J; Nuwaysir K; Pitas A; Richmond T; Gorski T; Berg JP; Ballin J; McCormick M; Norton J; Pollock T; Sumwalt T; Butcher L; Porter D; Molla M; Hall C; Blattner F; Sussman MR; Wallace RL; Cerrina F; Green RD (2002). «Анализ экспрессии генов с использованием массивов олигонуклеотидов, полученных методом безмасковой фотолитографии». Genome Res . 12 (11): 1749–1755. doi :10.1101/gr.362402. PMC 187555. PMID 12421762 .
^ Shalon D; Smith SJ; Brown PO (1996). «Система ДНК-микрочипов для анализа сложных образцов ДНК с использованием гибридизации двухцветных флуоресцентных зондов». Genome Res . 6 (7): 639–645. doi : 10.1101/gr.6.7.639 . PMID 8796352.
^ Tang T; François N; Glatigny A; Agier N; Mucchielli MH; Aggerbeck L; Delacroix H (2007). «Оценка коэффициента экспрессии в экспериментах с двухцветными микрочипами значительно улучшена за счет исправления несоответствия изображения». Bioinformatics . 23 (20): 2686–2691. doi : 10.1093/bioinformatics/btm399 . PMID 17698492.
^ Шафи, Томас; Лоу, Рохан (2017). «Структура эукариотических и прокариотических генов». WikiJournal of Medicine . 4 (1). doi : 10.15347/wjm/2017.002 . ISSN 2002-4436. S2CID 35766676.
^ Тинкер, Анна В.; Буссиутас, Алекс; Боутелл, Дэвид Д.Л. (2006). «Проблемы микрочипов экспрессии генов для изучения рака человека». Cancer Cell . 9 (5): 333–339. doi : 10.1016/j.ccr.2006.05.001 . ISSN 1535-6108. PMID 16697954.
^ Черчилль, GA (2002). "Основы экспериментального проектирования для микрочипов кДНК" (PDF) . Nature Genetics . дополнение. 32 : 490–5. doi :10.1038/ng1031. PMID 12454643. S2CID 15412245. Архивировано из оригинала (PDF) 8 мая 2005 г. . Получено 12 декабря 2013 г. .
^ Центр токсикоинформатики NCTR – Проект MAQC
^ "Просигна | Алгоритм Просигны" . prosigna.com . Проверено 22 июня 2017 г.
^ Little, MA; Jones, NS (2011). "Обобщенные методы и решатели для кусочно-постоянных сигналов: Часть I" (PDF) . Труды Королевского общества A. 467 ( 2135): 3088–3114. doi :10.1098/rspa.2010.0671. PMC 3191861. PMID 22003312 .
^ abc Петерсон, Лейф Э. (2013). Классификационный анализ ДНК-микрочипов. John Wiley and Sons. ISBN978-0-470-17081-6.
^ Де Соуто М и др. (2008) Кластеризация данных экспрессии генов рака: сравнительное исследование, BMC Bioinformatics, 9(497).
^ Jaskowiak, Pablo A; Campello, Ricardo JGB; Costa, Ivan G (2014). «О выборе соответствующих расстояний для кластеризации данных по экспрессии генов». BMC Bioinformatics . 15 (Suppl 2): S2. doi : 10.1186/1471-2105-15-S2-S2 . PMC 4072854. PMID 24564555 .
^ Большакова Н., Азуахе Ф. (2003) Методы проверки кластеров для данных об экспрессии генома, Обработка сигналов, т. 83, стр. 825–833.
^ Бен Гал, И.; Шани, А.; Гор, А.; Грау, Дж.; Арвив, С.; Шмиловичи, А.; Пош, С.; Гроссе, И. (2005). «Идентификация сайтов связывания факторов транскрипции с помощью байесовских сетей переменного порядка». Биоинформатика . 21 (11): 2657–2666. doi :10.1093/bioinformatics/bti410. ISSN 1367-4803. PMID 15797905.
^ Юк Фай Леунг и Дуччио Кавальери, Основы анализа данных микрочипов кДНК. Trends in Genetics Vol.19 No.11 Ноябрь 2003.
^ Принесс И.; Маймон О.; Бен-Гал И. (2007). «Оценка кластеризации генной экспрессии с помощью меры взаимного информационного расстояния». BMC Bioinformatics . 8 (1): 111. doi : 10.1186/1471-2105-8-111 . PMC 1858704. PMID 17397530 .
^ Wei C; Li J; Bumgarner RE (2004). «Размер выборки для обнаружения дифференциально экспрессируемых генов в экспериментах с микрочипами». BMC Genomics . 5 : 87. doi : 10.1186/1471-2164-5-87 . PMC 533874. PMID 15533245 .
^ Эммерт-Штрайб, Ф. и Демер, М. (2008). Анализ данных микрочипов: сетевой подход . Wiley-VCH. ISBN978-3-527-31822-3.
^ Wouters L; Gõhlmann HW; Bijnens L; Kass SU; Molenberghs G; Lewi PJ (2003). «Графическое исследование данных по экспрессии генов: сравнительное исследование трех многомерных методов». Biometrics . 59 (4): 1131–1139. CiteSeerX 10.1.1.730.3670 . doi :10.1111/j.0006-341X.2003.00130.x. PMID 14969494. S2CID 16248921.
^ Jain N; Thatte J; Braciale T; Ley K; O'Connell M; Lee JK (2003). «Тест локальной объединенной ошибки для идентификации дифференциально экспрессируемых генов с небольшим количеством реплицированных микрочипов». Биоинформатика . 19 (15): 1945–1951. doi : 10.1093/bioinformatics/btg264 . PMID 14555628.
^ Barbosa-Morais, NL; Dunning, MJ; Samarajiwa, SA; Darot, JFJ; Ritchie, ME; Lynch, AG; Tavare, S. (18 ноября 2009 г.). "Конвейер повторной аннотации для Illumina BeadArrays: улучшение интерпретации данных о экспрессии генов". Nucleic Acids Research . 38 (3): e17. doi :10.1093/nar/gkp942. PMC 2817484. PMID 19923232 .
^ Мортазави, Али; Брайан А. Уильямс; Кеннет МакКью; Лориан Шеффер; Барбара Уолд (июль 2008 г.). «Картирование и количественная оценка транскриптомов млекопитающих с помощью РНК-Seq». Nat Methods . 5 (7): 621–628. doi :10.1038/nmeth.1226. ISSN 1548-7091. PMID 18516045. S2CID 205418589.
^ ab Wang, Zhong; Mark Gerstein; Michael Snyder (январь 2009 г.). «RNA-Seq: революционный инструмент для транскриптомики». Nat Rev Genet . 10 (1): 57–63. doi :10.1038/nrg2484. ISSN 1471-0056. PMC 2949280. PMID 19015660 .