stringtranslate.com

Визуализация данных и информации

Профессор-статистик Эдвард Тафти описал график вторжения наполеоновской Франции в Россию, созданный Чарльзом Джозефом Минардом в 1869 году , как «возможно, лучший статистический график из когда-либо созданных», отметив, что он охватывает шесть переменных в двух измерениях. [1]

Визуализация данных и информации ( data viz/vis или info viz/vis ) [2] — это практика проектирования и создания простых в общении и понятных графических или визуальных представлений большого количества [3] сложных количественных и качественных данных и информации с помощью статических, динамических или интерактивных визуальных элементов. Обычно основанные на данных и информации, собранных из определенной области знаний , эти визуализации предназначены для более широкой аудитории, чтобы помочь им визуально исследовать и обнаруживать, быстро понимать, интерпретировать и получать важные сведения о трудно идентифицируемых структурах, отношениях, корреляциях, локальных и глобальных закономерностях, тенденциях, вариациях, постоянстве, кластерах, выбросах и необычных группировках в данных ( исследовательская визуализация ). [4] [5] [6] Когда они предназначены для широкой публики ( массовая коммуникация ) для передачи краткой версии известной, конкретной информации в ясной и увлекательной манере ( презентационная или пояснительная визуализация ), [4] их обычно называют информационной графикой .

Визуализация данных связана с визуальным представлением наборов в первую очередь количественных необработанных данных в схематической форме. Визуальные форматы, используемые при визуализации данных, включают таблицы , диаграммы и графики (например , круговые диаграммы , столбчатые диаграммы , линейные диаграммы , диаграммы с областями , конусные диаграммы, пирамидальные диаграммы, кольцевые диаграммы, гистограммы , спектрограммы , когортные диаграммы, каскадные диаграммы , воронкообразные диаграммы , маркированные диаграммы и т. д.), диаграммы , графики (например, диаграммы рассеяния , графики распределения, диаграммы типа «ящик с усами» ), геопространственные карты (например, карты пропорциональных символов , хороплеты , изоплеты и тепловые карты ), рисунки, корреляционные матрицы , процентные индикаторы и т. д., которые иногда можно объединить в панель инструментов .

С другой стороны, визуализация информации имеет дело с многочисленными, крупномасштабными и сложными наборами данных, которые содержат количественные (числовые) данные, а также качественные (нечисловые, т. е. вербальные или графические) и в первую очередь абстрактные данные, и ее цель состоит в том, чтобы добавить ценность необработанным данным, улучшить понимание зрителей, усилить их познание и помочь им получить понимание и принять решения, поскольку они перемещаются и взаимодействуют с графическим дисплеем, поддерживаемым компьютером. Визуальные инструменты, используемые в визуализации информации, включают карты (например, древовидные карты ), анимацию , инфографику , диаграммы Сэнки , блок -схемы , сетевые диаграммы , семантические сети , диаграммы сущностей-связей , диаграммы Венна , временные шкалы , интеллект-карты и т. д.

Новые технологии, такие как виртуальная , дополненная и смешанная реальность, обладают потенциалом сделать визуализацию информации более захватывающей, интуитивно понятной, интерактивной и легко управляемой и, таким образом, улучшить визуальное восприятие и познание пользователя . [7] В визуализации данных и информации цель состоит в том, чтобы графически представить и исследовать абстрактные, нефизические и непространственные данные, собранные из баз данных , информационных систем , файловых систем , документов , деловых и финансовых данных и т. д. ( презентационная и исследовательская визуализация ), что отличается от области научной визуализации , где цель состоит в том, чтобы визуализировать реалистичные изображения на основе физических и пространственных научных данных для подтверждения или опровержения гипотез ( подтверждающая визуализация ). [8]

Эффективная визуализация данных правильно получена, контекстуализирована, проста и не перегружена. Базовые данные точны и актуальны, чтобы гарантировать надежность идей. Графические элементы хорошо подобраны для заданных наборов данных и эстетически привлекательны, с формами, цветами и другими визуальными элементами, используемыми намеренно осмысленно и не отвлекая. Визуальные элементы сопровождаются вспомогательными текстами (метками и заголовками). Эти вербальные и графические компоненты дополняют друг друга, обеспечивая четкое, быстрое и запоминающееся понимание. Эффективная визуализация информации учитывает потребности и проблемы, а также уровень знаний целевой аудитории, намеренно направляя ее к предполагаемому выводу. [9] [3] Такая эффективная визуализация может использоваться не только для передачи специализированных, сложных, основанных на больших данных идей более широкой группе нетехнической аудитории визуально привлекательным, увлекательным и доступным образом, но также и для экспертов в предметной области и руководителей для принятия решений, мониторинга производительности, генерации новых идей и стимулирования исследований. [9] [4] Кроме того, специалисты по данным, аналитики данных и специалисты по добыче данных используют визуализацию данных для проверки качества данных, поиска ошибок, необычных пробелов и пропущенных значений в данных, очистки данных, изучения структур и особенностей данных и оценки результатов моделей, управляемых данными. [4] В бизнесе визуализация данных и информации может составлять часть повествования данных , где они сочетаются с последовательной повествовательной структурой или сюжетной линией для контекстуализации проанализированных данных и четкого и запоминающегося сообщения информации, полученной в результате анализа данных, с целью убедить аудиторию принять решение или предпринять действие для создания деловой ценности . [3] [10] Это можно противопоставить области статистической графики , где сложные статистические данные передаются графически точным и точным образом между исследователями и аналитиками, обладающими статистическими знаниями, чтобы помочь им выполнить исследовательский анализ данных или передать результаты такого анализа, где визуальная привлекательность, привлечение внимания к определенной проблеме и повествование не так важны. [11]

Область визуализации данных и информации носит междисциплинарный характер, поскольку она включает в себя принципы, найденные в дисциплинах описательной статистики (еще в 18 веке), [12] визуальной коммуникации , графического дизайна , когнитивной науки и, в последнее время, интерактивной компьютерной графики и взаимодействия человека с компьютером . [13] Поскольку эффективная визуализация требует навыков проектирования, статистических навыков и навыков вычисления, такие авторы, как Гершон и Пейдж, утверждают, что это одновременно и искусство, и наука. [14] Соседняя область визуальной аналитики объединяет статистический анализ данных, визуализацию данных и информации и человеческое аналитическое мышление через интерактивные визуальные интерфейсы, чтобы помочь людям-пользователям делать выводы, получать действенные идеи и принимать обоснованные решения, которые в противном случае компьютерам было бы трудно сделать.

Исследование того, как люди читают и неправильно читают различные типы визуализаций, помогает определить, какие типы и особенности визуализаций наиболее понятны и эффективны для передачи информации. [15] [16] С другой стороны, непреднамеренно плохие или намеренно вводящие в заблуждение и обманчивые визуализации ( дезинформативная визуализация ) могут функционировать как мощные инструменты, которые распространяют дезинформацию , манипулируют общественным восприятием и отвлекают общественное мнение в сторону определенной повестки дня. [17] Таким образом, грамотность визуализации данных стала важным компонентом грамотности данных и информации в информационную эпоху, подобно тому, как текстовая , математическая и визуальная грамотность играли роли в прошлом. [18]

Обзор

Визуализация данных — один из этапов анализа данных и представления их пользователям.
Частичная карта Интернета начала 2005 года, представленная в виде графика, каждая линия представляет два IP-адреса и некоторую задержку между этими двумя узлами.

Область визуализации данных и информации возникла «из исследований взаимодействия человека и компьютера , компьютерной науки , графики , визуального дизайна , психологии и бизнес-методов . Она все чаще применяется как важнейший компонент в научных исследованиях, цифровых библиотеках , интеллектуальном анализе данных , финансовом анализе данных, маркетинговых исследованиях, контроле производства и разработке лекарственных препаратов ». [19]

Визуализация данных и информации предполагает, что «визуальные представления и методы взаимодействия используют преимущества широкого диапазона пропускания человеческого глаза в разум, чтобы позволить пользователям видеть, исследовать и понимать большие объемы информации одновременно. Визуализация информации сосредоточена на создании подходов для передачи абстрактной информации интуитивными способами». [20]

Анализ данных является неотъемлемой частью всех прикладных исследований и решения проблем в промышленности. Наиболее фундаментальными подходами к анализу данных являются визуализация (гистограммы, диаграммы рассеяния, поверхностные диаграммы, древовидные карты, диаграммы параллельных координат и т. д.), статистика ( проверка гипотез , регрессия , PCA и т. д.), интеллектуальный анализ данных ( интеллектуальный анализ ассоциаций и т. д.) и методы машинного обучения ( кластеризация , классификация , деревья решений и т. д.). Среди этих подходов визуализация информации или визуальный анализ данных наиболее зависимы от когнитивных навыков аналитиков-людей и позволяют обнаруживать неструктурированные действенные идеи, которые ограничены только человеческим воображением и креативностью. Аналитику не нужно изучать какие-либо сложные методы, чтобы иметь возможность интерпретировать визуализации данных. Визуализация информации также является схемой генерации гипотез, которая может быть и обычно сопровождается более аналитическим или формальным анализом, таким как статистическая проверка гипотез.

Для четкой и эффективной передачи информации визуализация данных использует статистические графики , графики , информационные графики и другие инструменты. Числовые данные могут быть закодированы с использованием точек, линий или полос, чтобы визуально передать количественное сообщение. [21] Эффективная визуализация помогает пользователям анализировать и рассуждать о данных и доказательствах. [22] Она делает сложные данные более доступными, понятными и удобными для использования, но также может быть упрощенной. [23] У пользователей могут быть определенные аналитические задачи, такие как проведение сравнений или понимание причинно-следственной связи , и принцип проектирования графики (т. е. показ сравнений или показ причинно-следственной связи) следует за задачей. Таблицы обычно используются, когда пользователи будут искать определенное измерение, в то время как диаграммы различных типов используются для отображения закономерностей или взаимосвязей в данных для одной или нескольких переменных.

Визуализация данных относится к методам, используемым для передачи данных или информации путем кодирования их в виде визуальных объектов (например, точек, линий или полос), содержащихся в графиках. Цель состоит в том, чтобы четко и эффективно передавать информацию пользователям. Это один из шагов в анализе данных или науке о данных . По словам Виталия Фридмана (2008), «главная цель визуализации данных состоит в том, чтобы четко и эффективно передавать информацию с помощью графических средств. Это не означает, что визуализация данных должна выглядеть скучно, чтобы быть функциональной, или чрезвычайно сложной, чтобы выглядеть красивой. Для эффективной передачи идей и эстетическая форма, и функциональность должны идти рука об руку, обеспечивая понимание довольно разреженного и сложного набора данных, сообщая его ключевые аспекты более интуитивно понятным способом. Однако дизайнерам часто не удается достичь баланса между формой и функцией, создавая великолепные визуализации данных, которые не служат своей главной цели — передаче информации». [24]

Действительно, Фернанда Виегас и Мартин М. Ваттенберг предположили, что идеальная визуализация должна не только четко доносить информацию, но и стимулировать вовлеченность и внимание зрителя. [25]

Визуализация данных тесно связана с информационной графикой , визуализацией информации , научной визуализацией , разведывательным анализом данных и статистической графикой . В новом тысячелетии визуализация данных стала активной областью исследований, обучения и развития. Согласно Посту и др. (2002), она объединила научную и информационную визуализацию. [26]

В коммерческой среде визуализацию данных часто называют панелями мониторинга . Инфографика — еще одна очень распространенная форма визуализации данных.

Принципы

Характеристики эффективных графических дисплеев

Наибольшая ценность картины заключается в том, что она заставляет нас замечать то, чего мы никогда не ожидали увидеть.

Джон Тьюки [27]

Эдвард Тафти объяснил, что пользователи информационных дисплеев выполняют определенные аналитические задачи , такие как проведение сравнений. Принцип дизайна информационной графики должен поддерживать аналитическую задачу. [28] Как показывают Уильям Кливленд и Роберт Макгилл, различные графические элементы выполняют это более или менее эффективно. Например, точечные диаграммы и столбчатые диаграммы превосходят круговые диаграммы. [29]

В своей книге 1983 года «Визуальное отображение количественной информации » [30] Эдвард Тафти определяет «графические отображения» и принципы эффективного графического отображения в следующем отрывке: «Совершенство в статистической графике заключается в сложных идеях, переданных с ясностью, точностью и эффективностью. Графические отображения должны:

Графика раскрывает данные. Действительно, графика может быть более точной и показательной, чем обычные статистические вычисления." [31]

Например, диаграмма Минара показывает потери, понесенные армией Наполеона в период 1812–1813 годов. На график нанесены шесть переменных: размер армии, ее местоположение на двумерной поверхности (x и y), время, направление движения и температура. Ширина линии иллюстрирует сравнение (размер армии в определенные моменты времени), в то время как ось температуры указывает на причину изменения размера армии. Это многомерное отображение на двумерной поверхности рассказывает историю, которую можно понять немедленно, одновременно идентифицируя исходные данные для создания достоверности. Тафти писал в 1983 году, что: «Это вполне может быть лучшим статистическим графиком, когда-либо нарисованным». [31]

Неприменение этих принципов может привести к вводящим в заблуждение графикам , искажению сообщения или поддержке ошибочного вывода. По словам Тафти, графическим мусором называют постороннее внутреннее оформление графики, которое не усиливает сообщение, или необоснованные трехмерные или перспективные эффекты. Ненужное отделение пояснительного ключа от самого изображения, требующее, чтобы взгляд перемещался туда и обратно от изображения к ключу, является формой «административного мусора». Соотношение «данных к чернилам» должно быть максимизировано, стирая чернила, не относящиеся к данным, где это возможно. [31]

Бюджетное управление Конгресса обобщило несколько лучших практик для графических представлений в презентации в июне 2014 года. Они включали: a) Знание своей аудитории; b) Разработка графики, которая может существовать отдельно от контекста отчета; и c) Разработка графики, которая передает ключевые сообщения в отчете. [32]

Количественные сообщения

Тот же набор данных, представленный в виде трех диаграмм: Верхняя панель — столбчатая диаграмма, изображающая поток событий с течением времени (напоминает диаграмму Сэнки в оригинальной статье New York Times [33] ). Средняя панель — пузырьковая диаграмма, которая отдельно количественно оценивает дискретные результаты. Нижняя панель — это развернутая круговая диаграмма, показывающая относительные доли категорий и доли внутри категорий.

Автор Стивен Фью описал восемь типов количественных сообщений, которые пользователи могут попытаться понять или передать на основе набора данных, а также связанных с ними графиков, используемых для помощи в передаче сообщения:

  1. Временной ряд: фиксируется одна переменная за определенный период времени, например, уровень безработицы или показатели температуры за 10-летний период. Для демонстрации тенденции с течением времени можно использовать линейный график .
  2. Ранжирование: Категориальные подразделения ранжируются в порядке возрастания или убывания, например, рейтинг эффективности продаж ( мера ) по продавцам ( категория , где каждый продавец — это категориальное подразделение ) в течение одного периода. Для отображения сравнения по продавцам можно использовать столбчатую диаграмму .
  3. Часть к целому: Категориальные подразделения измеряются как отношение к целому (т. е. процент от 100%). Круговая диаграмма или столбчатая диаграмма могут отображать сравнение отношений, например, доли рынка, представляемой конкурентами на рынке.
  4. Отклонение: Категориальные подразделения сравниваются с эталоном, например, сравнение фактических и бюджетных расходов для нескольких отделов компании за определенный период времени. Столбчатая диаграмма может показать сравнение фактической и эталонной суммы.
  5. Частотное распределение: показывает количество наблюдений определенной переменной для заданного интервала, например, количество лет, в течение которых доходность фондового рынка находится в интервалах, например, 0–10%, 11–20% и т. д. Для этого анализа можно использовать гистограмму , тип столбчатой ​​диаграммы. Диаграмма ящиков помогает визуализировать ключевые статистические данные о распределении, такие как медиана, квартили, выбросы и т. д.
  6. Корреляция: Сравнение между наблюдениями, представленными двумя переменными (X,Y), чтобы определить, имеют ли они тенденцию двигаться в одном или противоположных направлениях. Например, построение графика безработицы (X) и инфляции (Y) для выборки месяцев. Для этого сообщения обычно используется диаграмма рассеяния .
  7. Номинальное сравнение: сравнение категориальных подразделений без определенного порядка, например, объем продаж по коду продукта. Для этого сравнения можно использовать столбчатую диаграмму.
  8. Географический или геопространственный : сравнение переменной на карте или макете, например, уровень безработицы по штату или количество людей на разных этажах здания. Картограмма — типичный используемый графический элемент. [21] [34]

Аналитики, просматривающие набор данных, могут рассмотреть, применимы ли некоторые или все сообщения и графические типы выше к их задаче и аудитории. Процесс проб и ошибок для выявления значимых связей и сообщений в данных является частью разведочного анализа данных .

Визуальное восприятие и визуализация данных

Человек может легко различать различия в длине линии, форме, ориентации, расстояниях и цвете (оттенке) без значительных усилий по обработке; это называется « предвнимательными атрибутами ». Например, может потребоваться значительное время и усилия («внимательная обработка»), чтобы определить, сколько раз цифра «5» появляется в ряду чисел; но если эта цифра отличается по размеру, ориентации или цвету, примеры этой цифры можно быстро заметить с помощью предвнимательной обработки. [35]

Убедительная графика использует преимущества предварительной обработки и атрибутов и относительной силы этих атрибутов. Например, поскольку люди могут легче обрабатывать различия в длине линии, чем в площади поверхности, может быть более эффективным использовать столбчатую диаграмму (которая использует преимущество длины линии для отображения сравнения), а не круговые диаграммы (которые используют площадь поверхности для отображения сравнения). [35]

Человеческое восприятие/познание и визуализация данных

Почти все визуализации данных создаются для потребления человеком. Знание человеческого восприятия и познания необходимо при разработке интуитивных визуализаций. [36] Познание относится к процессам в людях, таким как восприятие, внимание, обучение, память, мышление, формирование концепций, чтение и решение проблем. [37] Человеческая визуальная обработка эффективна при обнаружении изменений и проведении сравнений между количествами, размерами, формами и вариациями яркости. Когда свойства символических данных сопоставляются с визуальными свойствами, люди могут эффективно просматривать большие объемы данных. По оценкам, 2/3 нейронов мозга могут быть вовлечены в визуальную обработку. Правильная визуализация обеспечивает другой подход для показа потенциальных связей, отношений и т. д., которые не так очевидны в невизуализированных количественных данных. Визуализация может стать средством исследования данных .

Исследования показали, что люди в среднем использовали на 19% меньше когнитивных ресурсов и на 4,5% лучше вспоминали детали при сравнении визуализации данных с текстом. [38]

История

Избранные вехи и изобретения

Современное изучение визуализации началось с компьютерной графики , которая «с самого начала использовалась для изучения научных проблем. Однако на раннем этапе недостаток графической мощности часто ограничивал ее полезность. Недавнее внимание к визуализации началось в 1987 году со специального выпуска Computer Graphics on Visualization in Scientific Computing . С тех пор было проведено несколько конференций и семинаров, совместно спонсируемых IEEE Computer Society и ACM SIGGRAPH ». [39] Они были посвящены общим темам визуализации данных , визуализации информации и научной визуализации , а также более конкретным областям, таким как объемная визуализация . В 1786 году Уильям Плейфэр опубликовал первую презентационную графику.

Локализация пространства продукта , призванная показать экономическую сложность данной экономики.
Древовидная карта экспорта Бенина (2009) по категориям продуктов. Древовидные карты экспорта продуктов являются одним из последних приложений такого рода визуализаций, разработанных Обсерваторией экономической сложности Гарварда и Массачусетского технологического института .

Не существует всеобъемлющей «истории» визуализации данных. Не существует отчетов, которые охватывают все развитие визуального мышления и визуального представления данных и которые сопоставляют вклады разрозненных дисциплин. [40] Майкл Френдли и Дэниел Дж. Денис из Йоркского университета занимаются проектом, который пытается предоставить всеобъемлющую историю визуализации. Вопреки общему мнению, визуализация данных не является современной разработкой. С доисторических времен звездные данные или информация, такая как местоположение звезд, визуализировались на стенах пещер (например, тех, что были найдены в пещере Ласко на юге Франции) с эпохи плейстоцена . [41] Физические артефакты, такие как месопотамские глиняные жетоны (5500 г. до н. э.), кипу инков (2600 г. до н. э.) и палочные диаграммы Маршалловых островов (б. д.) также можно рассматривать как визуализацию количественной информации. [42] [43]

Первая задокументированная визуализация данных может быть прослежена до 1160 г. до н. э. с помощью карты Туринского папируса , которая точно иллюстрирует распределение геологических ресурсов и предоставляет информацию о добыче этих ресурсов. [44] Такие карты можно отнести к категории тематической картографии , которая является типом визуализации данных, которая представляет и передает определенные данные и информацию посредством географической иллюстрации, разработанной для показа определенной темы, связанной с определенной географической областью. Самыми ранними задокументированными формами визуализации данных были различные тематические карты из разных культур, а также идеограммы и иероглифы, которые предоставляли и позволяли интерпретировать иллюстрированную информацию. Например, таблички с линейным письмом B из Микен обеспечивали визуализацию информации, касающейся торговли эпохи позднего бронзового века в Средиземноморье. Идея координат использовалась древнеегипетскими геодезистами при планировке городов, земные и небесные положения определялись с помощью чего-то похожего на широту и долготу, по крайней мере, к 200 г. до н. э., а картографическая проекция сферической Земли на широту и долготу, созданная Клавдием Птолемеем [ ок.  85 г.ок.  165 г. ] в Александрии, служила эталоном вплоть до 14-го века. [44]

Изобретение бумаги и пергамента позволило дальнейшее развитие визуализаций на протяжении всей истории. На рисунке показан график 10-го или, возможно, 11-го века, который должен был быть иллюстрацией движения планет, использовавшейся в приложении к учебнику в монастырских школах. [45] График, по-видимому, должен был представлять собой график наклонов планетарных орбит как функции времени. Для этой цели зона зодиака была представлена ​​на плоскости с горизонтальной линией, разделенной на тридцать частей, как ось времени или продольная ось. Вертикальная ось обозначает ширину зодиака. Горизонтальный масштаб, по-видимому, был выбран для каждой планеты индивидуально, поскольку периоды не могут быть согласованы. Сопроводительный текст относится только к амплитудам. Кривые, по-видимому, не связаны во времени.

Планетарные движения

К XVI веку методы и инструменты для точного наблюдения и измерения физических величин, а также географического и небесного положения были хорошо развиты (например, «квадрант стены», построенный Тихо Браге [1546–1601], покрывающий всю стену в его обсерватории). Особенно важным было развитие триангуляции и других методов для точного определения местоположения на карте. [40] Очень рано измерение времени привело ученых к разработке инновационного способа визуализации данных (например, Лоренц Кодоманн в 1596 году, Иоганнес Темпорариус в 1596 году [46] ).

Французский философ и математик Рене Декарт и Пьер де Ферма разработали аналитическую геометрию и двумерную систему координат, которые оказали сильное влияние на практические методы отображения и вычисления значений. Работы Ферма и Блеза Паскаля по статистике и теории вероятностей заложили основу того, что мы сейчас концептуализируем как данные. [40] Согласно Interaction Design Foundation, эти разработки позволили и помогли Уильяму Плейфэру , который увидел потенциал для графической передачи количественных данных, создать и разработать графические методы статистики. [36]

Playfair TimeSeries

Во второй половине 20-го века Жак Бертен использовал количественные графики для представления информации «интуитивно, ясно, точно и эффективно» [36] .

Джон Тьюки и Эдвард Тафти раздвинули границы визуализации данных; Тьюки с его новым статистическим подходом разведочного анализа данных и Тафти с его книгой «Визуальное отображение количественной информации» проложили путь к совершенствованию методов визуализации данных для не только статистиков. С развитием технологий пришел прогресс и в визуализации данных; начиная с визуализаций, нарисованных от руки, и развиваясь в более технические приложения – включая интерактивные проекты, ведущие к программной визуализации. [47]

Такие программы, как SAS , SOFA , R , Minitab , Cornerstone и другие, позволяют визуализировать данные в области статистики. Другие приложения визуализации данных, более целенаправленные и уникальные для отдельных лиц, языки программирования, такие как D3 , Python и JavaScript, помогают сделать визуализацию количественных данных возможной. Частные школы также разработали программы для удовлетворения спроса на визуализацию данных обучения и связанных с ними библиотек программирования, включая бесплатные программы, такие как The Data Incubator , или платные программы, такие как General Assembly . [48]

Начиная с симпозиума «Data to Discovery» в 2013 году, ArtCenter College of Design, Caltech и JPL в Пасадене запустили ежегодную программу по интерактивной визуализации данных. [49] Программа задается вопросами: как интерактивная визуализация данных может помочь ученым и инженерам более эффективно исследовать свои данные? Как вычисления, дизайн и дизайн-мышление могут помочь максимизировать результаты исследований? Какие методологии наиболее эффективны для использования знаний из этих областей? Кодируя реляционную информацию с соответствующими визуальными и интерактивными характеристиками, чтобы помочь исследовать и в конечном итоге получить новое понимание данных, программа разрабатывает новые междисциплинарные подходы к сложным научным проблемам, объединяя дизайн-мышление и новейшие методы из вычислений, дизайна, ориентированного на пользователя, дизайна взаимодействия и 3D-графики.

Терминология

Визуализация данных подразумевает определенную терминологию, часть которой взята из статистики. Например, автор Стивен Фью определяет два типа данных, которые используются в сочетании для поддержки осмысленного анализа или визуализации:

Различие между количественными и категориальными переменными важно, поскольку эти два типа требуют разных методов визуализации.

Двумя основными типами отображения информации являются таблицы и графики.

Эпплер и Ленглер разработали «Периодическую таблицу методов визуализации», интерактивную диаграмму, отображающую различные методы визуализации данных. Она включает шесть типов методов визуализации данных: данные, информация, концепция, стратегия, метафора и соединение. [52] В «Анализе и дизайне визуализации» Тамара Манцнер пишет: «Системы визуализации на базе компьютера обеспечивают визуальное представление наборов данных, разработанных для того, чтобы помочь людям выполнять задачи более эффективно». Манцнер утверждает, что визуализация «подходит, когда необходимо расширить человеческие возможности, а не заменять людей вычислительными методами принятия решений». [53]

Техники

Другие методы

Интерактивность

Интерактивная визуализация данных позволяет выполнять прямые действия на графическом графике для изменения элементов и установления связей между несколькими графиками. [56]

Интерактивная визуализация данных была целью статистиков с конца 1960-х годов. Примеры разработок можно найти в библиотеке видеозаимствований Американской статистической ассоциации . [57]

К распространенным взаимодействиям относятся:

Другие точки зрения

Существуют различные подходы к области визуализации данных. Один из них, как правило, фокусируется на представлении информации, например, Фридман (2008). Френдли (2008) предполагает две основные части визуализации данных: статистическую графику и тематическую картографию . [58] В этой же строке статья «Визуализация данных: современные подходы» (2007) дает обзор семи тем визуализации данных: [59]

Все эти предметы тесно связаны с графическим дизайном и представлением информации.

С другой стороны, с точки зрения компьютерной науки , Фриц Х. Пост в 2002 году разделил эту область на подобласти: [26] [60]

В Harvard Business Review Скотт Беринато разработал структуру подхода к визуализации данных. [61] Чтобы начать мыслить визуально, пользователи должны рассмотреть два вопроса: 1) Что у вас есть и 2) Что вы делаете. Первый шаг — определить, какие данные вы хотите визуализировать. Это данные, такие как прибыль за последние десять лет или концептуальная идея, например, как структурирована конкретная организация. Как только на этот вопрос получен ответ, можно сосредоточиться на том, пытаются ли они передать информацию (декларативная визуализация) или пытаются что-то выяснить (исследовательская визуализация). Скотт Беринато объединяет эти вопросы, чтобы дать четыре типа визуальной коммуникации, каждый из которых имеет свои собственные цели. [61]

Эти четыре типа визуальной коммуникации следующие:

Приложения

Визуализация данных и информации находит применение в таких областях, как: [19]

Организация

Известные академические и отраслевые лаборатории в этой области:

Конференции в этой области, ранжированные по значимости в исследованиях визуализации данных, [63] :

Дополнительные примеры см. в разделе: Категория:Организации компьютерной графики

Архитектура представления данных

Визуализация данных из социальных сетей

Архитектура представления данных ( DPA ) — это набор навыков, направленных на идентификацию, определение местоположения, обработку, форматирование и представление данных таким образом, чтобы оптимально передавать смысл и необходимые знания.

Исторически термин « архитектура представления данных» приписывается Келли Лаутту: [a] «Архитектура представления данных (DPA) — это редко применяемый набор навыков, критически важный для успеха и ценности бизнес-аналитики . Архитектура представления данных объединяет науку о числах, данных и статистике в извлечении ценной информации из данных и превращении ее в пригодную для использования, релевантную и применимую на практике с искусством визуализации данных, коммуникаций, организационной психологии и управления изменениями , чтобы предоставить решениям бизнес-аналитики объем данных, сроки поставки, формат и визуализации, которые будут наиболее эффективно поддерживать и направлять операционное, тактическое и стратегическое поведение к понятным бизнес- (или организационным) целям. DPA не является ни ИТ-, ни бизнес-навыками, а существует как отдельная область знаний. Архитектура представления данных, которую часто путают с визуализацией данных, — это гораздо более широкий набор навыков, который включает определение того, какие данные, по какому графику и в каком точном формате должны быть представлены, а не просто наилучший способ представления данных, который уже выбран. Навыки визуализации данных являются одним из элементов DPA».

Цели

DPA преследует две основные цели:

Объем

Учитывая вышеизложенные цели, фактическая работа по архитектуре представления данных состоит из:

Связанные поля

Работа DPA имеет общие черты с рядом других областей, включая:

Смотрите также

Примечания

  1. ^ Первые официальные, зафиксированные, публичные использования термина архитектура представления данных были на трех официальных мероприятиях Microsoft Office 2007 Launch в декабре, январе и феврале 2007–08 в Эдмонтоне, Калгари и Ванкувере (Канада) в презентации Келли Лаутт, описывающей систему бизнес-аналитики, разработанную для улучшения качества обслуживания в целлюлозно-бумажной компании. Термин был далее использован и зафиксирован в публичном использовании 16 декабря 2009 года в презентации Microsoft Canada о ценности слияния бизнес-аналитики с корпоративными процессами сотрудничества.

Ссылки

  1. ^ Корбетт, Джон. "Charles Joseph Minard: Mapping Napoleon's March, 1861". Центр пространственно-интегрированной социальной науки. Архивировано из оригинала 19 июня 2003 г.(Сайт CSISS переехал; воспользуйтесь ссылкой на архив для статьи)
  2. ^ Шеван, Дэн (5 октября 2016 г.). «Данные прекрасны: 7 инструментов визуализации данных для цифровых маркетологов». Business2Community . Архивировано из оригинала 12 ноября 2016 г.
  3. ^ abc Nussbaumer Knaflic, Cole (2 ноября 2015 г.). Storytelling with Data: A Data Visualization Guide for Business Professionals . John Wiley & Sons. ISBN 978-1-119-00225-3.
  4. ^ abcd Энтони Анвин (31 января 2020 г.). «Почему важна визуализация данных? Что важно в визуализации данных?». Harvard Data Science Review . 2 (1). doi : 10.1162/99608f92.8ae4d525 . Получено 27 марта 2023 г.
  5. ^ Ананда Митра (2018), «Управление и визуализация неструктурированных больших данных», Энциклопедия информационной науки и технологий (4-е изд.), IGI Global
  6. ^ Бхуванендра Путчала; Лася Шривидья Канала; Деви Прасанна Донепуди; Хари Кишан Кондавити (2023 г.), «Применение анализа больших данных в информатике здравоохранения», в Нарасимхе Рао Ваджжале; Филип Иппен (ред.), Информатика здравоохранения и безопасность пациентов во время кризиса , IGI Global, стр. 175–194.
  7. ^ Ольшанникова, Екатерина; Ометов, Александр; Кучерявый, Евгений; Оллсон, Томас (2015), «Визуализация больших данных с помощью дополненной и виртуальной реальности: проблемы и исследовательская программа». Журнал больших данных , 2 (22), doi : 10.1186/s40537-015-0031-2
  8. ^ Кард, Маккинли и Шнейдерман (1999), Чтения по визуализации информации: использование зрения для мышления , Морган Кауфманн, стр. 6–7{{citation}}: CS1 maint: multiple names: authors list (link)
  9. ^ ab "Что такое визуализация данных?". IBM . Получено 27 марта 2023 г.
  10. ^ Брент Дайкс (2019), Эффективное повествование данных: как управлять изменениями с помощью данных, повествования и визуальных эффектов , John Wiley & Sons, стр. 16
  11. ^ Дэвид С. Леблан (2004), Статистика: концепции и приложения для науки , Jones & Bartlett Learning, стр. 35–36
  12. ^ Гранджин, Мартин (2022). «Визуализация данных для истории». Справочник по цифровой публичной истории : 291–300. doi : 10.1515/9783110430295-024. ISBN 9783110430295.
  13. ^ EH Chi (2013), Структура визуализации информации , Springer Science & Business Media, стр. xxiii
  14. ^ Гершон, Наум; Пейдж, Уорд (1 августа 2001 г.). «Что повествование может сделать для визуализации информации». Communications of the ACM . 44 (8): 31–37. doi :10.1145/381641.381653. S2CID  7666107.
  15. ^ Мейсон, Бетси (12 ноября 2019 г.). «Почему ученым нужно лучше визуализировать данные». Knowable Magazine . doi : 10.1146/knowable-110919-1 .
  16. ^ О'Донохью, Шон И.; Балди, Бенедетта Фрида; Кларк, Сьюзан Дж.; Дарлинг, Аарон Э.; Хоган, Джеймс М.; Каур, Сандип; Майер-Хайн, Лена; Маккарти, Дэвис Дж.; Мур, Уильям Дж.; Стенау, Эстер; Сведлоу, Джейсон Р.; Вуонг, Дженни; Проктер, Джеймс Б. (2018-07-20). "Визуализация биомедицинских данных". Annual Review of Biomedical Data Science . 1 (1): 275–304. doi :10.1146/annurev-biodatasci-080917-013424. hdl : 10453/125943 . S2CID  199591321 . Получено 25 июня 2021 г.
  17. ^ Лео Ю-Хо Ло; Аюш Гупта; Кэнто Шигио; Аою Ву; Энрико Бертини; Хуамин Цюй, Введенные в заблуждение визуализацией: чему нас учат дезинформирующие визуализации?
  18. ^ Бёрнер, К.; Бьюкл, А.; Гинда, М. (2019), «Грамотность визуализации данных: определения, концептуальные рамки, упражнения и оценки», Труды Национальной академии наук , 116 (6): 1857–1864, Bibcode : 2019PNAS..116.1857B, doi : 10.1073/pnas.1807180116 , PMC 6369751 , PMID  30718386 
  19. ^ ab Бенджамин Б. Бедерсон и Бен Шнейдерман (2003). Искусство визуализации информации: чтения и размышления, Morgan Kaufmann ISBN 1-55860-915-6
  20. ^ Джеймс Дж. Томас и Кристин А. Кук (ред.) (2005). Освещение пути: программа НИОКР для визуальной аналитики. Архивировано 29 сентября 2008 г. в Wayback Machine . Национальный центр визуализации и аналитики. стр. 30
  21. ^ ab "Stephen Few-Perceptual Edge-Selecting the Right Graph for Your Message-2004" (PDF) . Архивировано (PDF) из оригинала 2014-10-05 . Получено 2014-09-08 .
  22. ^ «10 примеров визуализации данных интерактивной карты».
  23. ^ Энгебрецен, Мартин; Хелен, Кеннеди, ред. (16 апреля 2020 г.). Визуализация данных в обществе. Nieuwe Prinsengracht 89 1018 VR Амстердам Нидерланды: Издательство Амстердамского университета. дои : 10.5117/9789463722902_ch02. ISBN 978-90-485-4313-7.{{cite book}}: CS1 maint: location (link)
  24. Виталий Фридман (2008) «Визуализация данных и инфографика». Архивировано 22 июля 2008 г. на Wayback Machine в разделе: Графика , Monday Inspiration, 14 января 2008 г.
  25. ^ Виегас, Фернанда; Ваттенберг, Мартин (19 апреля 2011 г.). «Как сделать данные привлекательными». CNN . Архивировано из оригинала 6 мая 2011 г. Получено 7 мая 2017 г.
  26. ^ ab Фриц Х. Пост, Грегори М. Нильсон и Жорж-Пьер Бонно (2002). Визуализация данных: современное состояние. Научная работа TU delft, 2002. Архивировано 2009-10-07 в Wayback Machine .
  27. ^ Tukey, John (1977). Исследовательский анализ данных . Addison-Wesley. ISBN 0-201-07616-0.
  28. ^ techatstate (7 августа 2013 г.). «Tech@State: Визуализация данных — Основной доклад доктора Эдварда Тафти». Архивировано из оригинала 29 марта 2017 г. Получено 29 ноября 2016 г. — через YouTube.
  29. ^ Кливленд, WS; Макгилл, Р. (1985). «Графическое восприятие и графические методы анализа научных данных». Science . 229 (4716): 828–33. Bibcode :1985Sci...229..828C. doi :10.1126/science.229.4716.828. PMID  17777913. S2CID  16342041.
  30. ^ Тафти, Эдвард Р. (1983). Визуальное отображение количественной информации (2-е изд.). Чешир, Коннектикут, США: Graphics Press LLC. ISBN 9780318029924.
  31. ^ abc Tufte, Edward (1983). Визуальное отображение количественной информации. Чешир, Коннектикут: Graphics Press. ISBN 0-9613921-4-2. Архивировано из оригинала 2013-01-14 . Получено 2019-08-10 .
  32. ^ "Рассказывание визуальных историй о данных - Бюджетное управление Конгресса". www.cbo.gov . Архивировано из оригинала 2014-12-04 . Получено 2014-11-27 .
  33. ^ Бьюкенен, Ларри; Летерби, Лорен (22 июня 2022 г.). «Кто остановит «плохого парня с пистолетом»?». The New York Times . Архивировано из оригинала 22 июня 2022 г. Источник данных: Advanced Law Enforcement Rapid Response Training Center
  34. ^ "Stephen Few-Perceptual Edge-Graph Selection Matrix" (PDF) . Архивировано (PDF) из оригинала 2014-10-05 . Получено 2014-09-08 .
  35. ^ ab "Steven Few-Tapping the Power of Visual Perception-September 2004" (PDF) . Архивировано (PDF) из оригинала 2014-10-05 . Получено 2014-10-08 .
  36. ^ abc "Визуализация данных для восприятия человеком". The Interaction Design Foundation . Архивировано из оригинала 2015-11-23 . Получено 2015-11-23 .
  37. ^ "Визуализация" (PDF) . SFU . Лекция SFU. Архивировано из оригинала (PDF) 2016-01-22 . Получено 2015-11-22 .
  38. ^ Грэм, Фиона (2012-04-17). «Могут ли изображения остановить перегрузку данными?». BBC News . Получено 2020-07-30 .
  39. ^ G. Scott Owen (1999). История визуализации. Архивировано 08.10.2012 на Wayback Machine . Доступ 19 января 2010 г.
  40. ^ abc Friendly, Michael (2008). "Краткая история визуализации данных". Справочник по визуализации данных . Springer-Verlag. С. 15–56. doi :10.1007/978-3-540-33037-0_2. ISBN 9783540330370. S2CID  62626937.
  41. Whitehouse, D. (9 августа 2000 г.). «Обнаружена карта звезд ледникового периода». BBC News . Архивировано из оригинала 6 января 2018 г. Получено 20 января 2018 г.
  42. ^ Драгичевич, Пьер; Янсен, Ивонн (2012). «Список физических визуализаций и связанных с ними артефактов». Архивировано из оригинала 2018-01-13 . Получено 2018-01-12 .
  43. ^ Янсен, Ивонн; Драгичевич, Пьер; Айзенберг, Петра ; Александр, Джейсон; Карник, Абхиджит; Килдал, Йохан; Субраманиан, Шрирам; Хорнбек, Каспер (2015). «Возможности и проблемы физикализации данных». Труды 33-й ежегодной конференции ACM по человеческому фактору в вычислительных системах : 3227–3236. Архивировано из оригинала 13.01.2018 . Получено 12.01.2018 .
  44. ^ ab Friendly, Michael (2001). "Вехи в истории тематической картографии, статистической графики и визуализации данных". Архивировано из оригинала 2014-04-14.
  45. Funkhouser, Howard Gray (январь 1936 г.). «Заметка о графике десятого века». Osiris . 1 : 260–262. doi :10.1086/368425. JSTOR  301609. S2CID  144492131.
  46. ^ "Визуализация данных: определение, примеры, инструменты, советы [руководство 2020]". Консалтинг по исследованию рынка . 2020-12-09 . Получено 2020-12-09 .
  47. ^ Френдли, Майкл (2006). "Краткая история визуализации данных" (PDF) . Йоркский университет . Springer-Verlag. Архивировано (PDF) из оригинала 2016-05-08 . Получено 2015-11-22 .
  48. ^ "Нью-Йорк получает новый учебный лагерь для специалистов по данным: он бесплатный, но попасть туда сложнее, чем в Гарвард". Venture Beat . Архивировано из оригинала 2016-02-15 . Получено 2016-02-21 .
  49. ^ Интерактивная визуализация данных
  50. ^ ab Bulmer, Michael (2013). Портативное введение в анализ данных . Университет Квинсленда: Центр публикации по запросу. стр. 4–5. ISBN 978-1-921723-10-0.
  51. ^ "Стивен Фью-Выбор правильного графика для вашего сообщения-Сентябрь 2004" (PDF) . Архивировано (PDF) из оригинала 2014-10-05 . Получено 2014-09-08 .
  52. ^ Ленглер, Ральф; Эпплер, Мартин. Дж . «Периодическая таблица методов визуализации». www.visual-literacy.org. Архивировано из оригинала 16 марта 2013 г. Получено 15 марта 2013 г.
  53. ^ Манцнер, Тамара; Магуайр, Имонн (2015). Анализ и дизайн визуализации . Серия визуализаций AK Peters. Бока-Ратон Лондон Нью-Йорк: CRC Press. ISBN 978-1-4665-0891-0.
  54. ^ Кан, Брайан (17 июня 2019 г.). «Эта поразительная визуализация изменения климата теперь настраивается для любого места на Земле». Gizmodo . Архивировано из оригинала 26 июня 2019 г.Разработано в мае 2018 года Эдом Хокинсом , Университет Рединга .
  55. ^ Муни, Крис (11 мая 2016 г.). «Этот ученый просто изменил наше представление об изменении климата с помощью одного GIF». The Washington Post . Архивировано из оригинала 6 февраля 2019 г. Эд Хокинс взял эти ежемесячные данные о температуре и построил их в форме спирали, так что для каждого года было двенадцать точек, по одной на каждый месяц, вокруг центра круга — с более высокими температурами дальше наружу и более низкими температурами ближе к центру.
  56. ^ Свэйн, Дебора (1999). «Введение в специальный выпуск по интерактивному графическому анализу данных: что такое взаимодействие?». Computational Statistics . 14 (1): 1–6. doi :10.1007/PL00022700. S2CID  86788346.
  57. ^ Американская статистическая ассоциация, Секция статистической графики. "Библиотека видеоаренды". Архивировано из оригинала 20.01.2021 . Получено 17.02.2021 .
  58. ^ Майкл Френдли (2008). «Вехи в истории тематической картографии, статистической графики и визуализации данных» Архивировано 11 сентября 2008 г. на Wayback Machine .
  59. ^ "Визуализация данных: современные подходы" Архивировано 22 июля 2008 г. на Wayback Machine . в: Графика , 2 августа 2007 г.
  60. ^ Фриц Х. Пост, Грегори М. Нильсон и Жорж-Пьер Бонно (2002). Визуализация данных: современное состояние. Архивировано 7 октября 2009 г. на Wayback Machine .
  61. ^ abcdef Беринато, Скотт (июнь 2016 г.). «Визуализации, которые действительно работают». Harvard Business Review : 92–100.
  62. ^ Фейсал, Сара; Блэндфорд, Энн; Поттс, Генри WW (2013). «Осмысление личной медицинской информации: проблемы визуализации информации» (PDF) . Журнал медицинской информатики . 19 (3): 198–217. doi :10.1177/1460458212465213. PMID  23981395. S2CID  3825148.
  63. ^ Косара, Роберт (11 ноября 2013 г.). «Руководство по качеству различных визуализационных площадок». rusheyes . Получено 7 апреля 2017 г. .

Дальнейшее чтение

Внешние ссылки