stringtranslate.com

Гранд Тур (визуализация данных)

Grand Tour — это метод, изначально разработанный Дэниелом Азимовым в 1980–1985 годах, который используется для исследования многомерных статистических данных с помощью анимации. Анимация, или «фильм», состоит из серии отдельных представлений данных, которые видны с разных направлений, отображаемых на экране компьютера, которые, как кажется, непрерывно меняются и становятся все ближе и ближе ко всем возможным представлениям. Это позволяет проводить оценку этих представлений человеком или компьютером с целью обнаружения закономерностей, которые будут передавать полезную информацию о данных.

Этот прием похож на то, что делают многие посетители музеев, когда сталкиваются со сложной абстрактной скульптурой: они обходят ее, чтобы рассмотреть со всех сторон, чтобы лучше понять ее. Зрительная система человека воспринимает визуальную информацию как рисунок на сетчатке, который является двумерным. Таким образом, обход скульптуры с целью лучшего ее понимания создает временную последовательность двумерных изображений в мозге.

Многомерные данные, которые являются исходными входными данными для любой визуализации большого тура, представляют собой (конечный) набор точек в некотором многомерном евклидовом пространстве. Этот тип набора возникает естественным образом при сборе данных. Предположим, что для некоторой популяции из 1000 человек каждого человека просят указать свой возраст, рост, вес и количество волос в носу. Таким образом, с каждым членом популяции связана упорядоченная четверка чисел. Поскольку n -мерное евклидово пространство определяется как все упорядоченные n-кортежи чисел, это означает, что данные о 1000 человек соответствуют 1000 точкам в 4-мерном евклидовом пространстве.

Grand Tour преобразует пространственную сложность многомерного набора данных во временную сложность, используя относительно простые двумерные представления проецируемых данных в качестве отдельных кадров фильма. (Иногда их называют «представлениями данных».) Проекции обычно выбираются таким образом, чтобы они не менялись слишком быстро, а это означает, что фильм данных будет казаться человеку-наблюдателю непрерывным .

Гранд-тур "метод" - это алгоритм назначения последовательности проекций на (обычно) 2-мерные плоскости любому заданному измерению евклидова пространства. Это позволяет проецировать любой конкретный многомерный набор данных на эту последовательность 2-мерных плоскостей и, таким образом, отображать их на экране компьютера одну за другой, так что эффект заключается в создании фильма из данных.

(Обратите внимание, что после того, как данные спроецированы на заданную 2-плоскость, для их отображения на экране компьютера необходимо выбрать направления в этой 2-плоскости, которые будут соответствовать горизонтальным и вертикальным направлениям на экране компьютера. Обычно это незначительная деталь. Но выбор горизонтальных и вертикальных направлений в идеале должен быть сделан таким образом, чтобы свести к минимуму любое ненужное видимое «вращение» 2-мерного представления данных.)

Техническое описание

Каждый «вид» (т. е. кадр) анимации представляет собой ортогональную проекцию набора данных на двумерное подпространство (евклидова пространства R p , где находятся данные). Подпространства выбираются путем небольших шагов вдоль непрерывной кривой, параметризованной временем, в пространстве всех двумерных подпространств R p (известном как грассманиан G (2, p )). Чтобы отобразить эти виды на экране компьютера, необходимо выбрать одну конкретную повернутую позицию каждого вида (в плоскости экрана компьютера) для отображения. Это приводит к тому, что положения точек данных на экране компьютера кажутся непрерывно меняющимися. Азимов показал, что эти подпространства можно выбрать так, чтобы сделать их набор (до момента времени  t ) все более близким ко всем точкам в G (2, p ), так что если бы фильму Grand Tour было разрешено воспроизводиться бесконечно, набор отображаемых подпространств соответствовал бы плотному подмножеству G (2, p ). [1] [ 2]

Программное обеспечение

Ссылки

  1. ^ Азимов, Дэниел. (1985). Грандиозный тур: инструмент для просмотра многомерных данных. Журнал SIAM по научным и статистическим вычислениям , 6(1), 128–143.
  2. ^ Ху, Мун Юл и Киёль Ким. (2002) Визуализация многомерных данных с использованием модификаций Grand Tour. Журнал прикладной статистики 29.5: 721–728.