stringtranslate.com

Целенаправленное преследование проекции

В этом примере целевое преследование проекций используется для изучения проекций набора данных экспрессии генов . Каждая из 122 точек соответствует образцу, взятому из раковой опухоли четырех диагностических классов (представленных цветом). Для каждого образца был записан уровень экспрессии 100 генов (представлен осями). Анимация показывает, что TPP способен четко разделить два класса (красный и фиолетовый), но два других не удалось различить (синий и зеленый). Затем положение осей указывает на активацию генов, наиболее связанных с каждым классом.

Целевое проекционное преследование — это тип статистического метода, используемого для разведочного анализа данных , визуализации информации и выбора признаков . Он позволяет пользователю интерактивно исследовать очень сложные данные (обычно имеющие десятки или сотни атрибутов) для поиска признаков или моделей, представляющих потенциальный интерес.

Традиционное, или «слепое», преследование проекций находит наиболее «интересные» возможные проекции в многомерных данных, используя алгоритм поиска , который оптимизирует некоторый фиксированный критерий «интересности» – например, отклонение от нормального распределения . Напротив, целенаправленное преследование проекций позволяет пользователю исследовать пространство проекций, манипулируя точками данных непосредственно на интерактивной диаграмме рассеяния .

Метод целенаправленного проецирования нашел применение в анализе данных ДНК-микрочипов , [1] анализе белковых последовательностей , [2] компоновке графов [3] и цифровой обработке сигналов . [4] Он доступен в виде пакета для набора инструментов машинного обучения WEKA .

Ссылки

  1. ^ Фейт, Джозеф; Роберт Минтрам; Майя Ангелова (2006). «Целевое проектирование для визуализации классификаций данных по экспрессии генов» (PDF) . Биоинформатика . 22 (21): 2667–267. doi : 10.1093/bioinformatics/btl463 . PMID  16954139.
  2. ^ Haddow, Chris; Marcus Durrant; Justin Perry; Joe Faith (2011). «Предсказание функциональных остатков выравниваний последовательностей белков как задача выбора признаков». Международный журнал по интеллектуальному анализу данных и биоинформатике . 5 (6): 691–705. doi :10.1504/IJDMB.2011.045417. PMID  22295751.
  3. ^ Гибсон, Хелен; Джо Фейт (2011). «Макет графа атрибутов узлов для сетей малого мира». Труды 15-й Международной конференции по визуализации информации .
  4. ^ Суджан, Раджбхандари; Джо Фейт (2010). «Использование линейных проекций при визуальном анализе сигналов в оптической беспроводной связи внутри помещений». 2010 7-й Международный симпозиум по системам связи, сетям и цифровой обработке сигналов (CSNDSP 2010) . IEEE. стр. 576–581. doi :10.1109/CSNDSP16145.2010.5580367. ISBN 978-1-4244-8858-2.

Дальнейшее чтение

Внешние ссылки