Визуальная аналитика является развитием областей визуализации информации и научной визуализации , которая фокусируется на аналитическом рассуждении , осуществляемом с помощью интерактивных визуальных интерфейсов . [1]
Визуальная аналитика — это «наука об аналитическом рассуждении, которому способствуют интерактивные визуальные интерфейсы». [2] Он может решить определенные проблемы, размер, сложность и необходимость тесно связанного человеческого и машинного анализа могут сделать их неразрешимыми в противном случае. [3] Визуальная аналитика способствует развитию науки и технологий в области аналитических рассуждений, взаимодействия, преобразования и представления данных для вычислений и визуализации, аналитической отчетности и перехода к технологиям. [4] В качестве исследовательской программы визуальная аналитика объединяет несколько научных и технических сообществ из области информатики, визуализации информации, когнитивных и перцептивных наук, интерактивного дизайна, графического дизайна и социальных наук.
Визуальная аналитика объединяет новые вычислительные и теоретические инструменты с инновационными интерактивными методами и визуальными представлениями , позволяющими вести диалог между людьми и информацией. Разработка инструментов и методов основана на когнитивных , дизайнерских и перцептивных принципах. Эта наука аналитического рассуждения обеспечивает основу для рассуждений, на основе которой можно строить как стратегические, так и тактические технологии визуальной аналитики для анализа, предотвращения и реагирования на угрозы. Аналитическое рассуждение занимает центральное место в задаче аналитика по применению человеческих суждений для получения выводов на основе комбинации доказательств и предположений. [2]
Визуальная аналитика имеет некоторые пересекающиеся цели и методы с визуализацией информации и научной визуализацией . В настоящее время нет четкого консенсуса относительно границ между этими областями, но в целом эти три области можно разделить следующим образом:
Визуальная аналитика стремится объединить методы визуализации информации с методами вычислительного преобразования и анализа данных. Визуализация информации является частью прямого интерфейса между пользователем и машиной, расширяя когнитивные способности человека шестью основными способами: [2] [5]
Эти возможности визуализации информации в сочетании с вычислительным анализом данных могут быть применены к аналитическому рассуждению для поддержки процесса осмысления.
Визуальная аналитика — это междисциплинарная область, включающая следующие направления: [2]
Методы аналитического рассуждения — это метод, с помощью которого пользователи получают глубокую информацию, которая напрямую поддерживает оценку ситуации, планирование и принятие решений. Визуальная аналитика должна способствовать высококачественному человеческому суждению при ограниченных затратах времени аналитиков. Инструменты визуальной аналитики должны решать разнообразные аналитические задачи, такие как: [2]
Эти задачи будут выполняться путем сочетания индивидуального и совместного анализа, часто в условиях крайнего дефицита времени. Визуальная аналитика должна обеспечивать аналитические методы, основанные на гипотезах и сценариях, обеспечивая аналитику возможность рассуждать на основе имеющихся данных. [2]
Представления данных представляют собой структурированные формы, подходящие для компьютерных преобразований. Эти структуры должны существовать в исходных данных или быть выведены из самих данных. Они должны в максимально возможной степени сохранять содержание информации и знаний, а также связанный с ними контекст в исходных данных. Структуры базовых представлений данных обычно не доступны и не интуитивно понятны пользователю инструмента визуального анализа. Зачастую они более сложны по своей природе, чем исходные данные, и не обязательно меньше по размеру, чем исходные данные. Структуры представлений данных могут содержать сотни или тысячи измерений и быть непонятными для человека, но их необходимо трансформировать в представления более низкой размерности для визуализации и анализа. [2]
Теории визуализации включают: [3]
Визуальные представления переводят данные в видимую форму, которая подчеркивает важные особенности, включая общие черты и аномалии. Эти визуальные представления позволяют пользователям быстро воспринимать существенные аспекты своих данных. Дополнение процесса когнитивного рассуждения перцептивным рассуждением посредством визуальных представлений позволяет процессу аналитического рассуждения стать быстрее и более целенаправленным. [2]
Входными данными для наборов данных, используемых в процессе визуальной аналитики, являются разнородные источники данных (т. е. Интернет, газеты, книги, научные эксперименты, экспертные системы ). Из этих богатых источников выбираются наборы данных S = S 1 , ..., S m , тогда как каждый Si , i ∈ (1, ..., m) состоит из атрибутов A i1 , ..., A ik . Целью или результатом процесса является понимание I. Инсайт получается либо непосредственно из набора созданных визуализаций V , либо через подтверждение гипотез H как результаты автоматизированных методов анализа. Такая формализация процесса визуальной аналитики проиллюстрирована на следующем рисунке. Стрелки обозначают переходы от одного набора к другому.
Более формально процесс визуальной аналитики представляет собой преобразование F: S → I , тогда как F представляет собой конкатенацию функций f ∈ {D W , V X , H Y , U Z } , определяемых следующим образом:
D W описывает базовые функции предварительной обработки данных с помощью D W : S → S и W ∈ {T, C, SL, I} , включая функции преобразования данных D T , функции очистки данных D C , функции выбора данных D SL и интеграцию данных. функции D I , которые необходимы для того, чтобы функции анализа были применимы к набору данных.
V W , W ∈ {S, H} символизирует функции визуализации, которые являются либо функциями визуализации данных V S : S → V , либо функциями визуализации гипотез V H : H → V .
H Y , Y ∈ {S, V} представляет собой процесс генерации гипотез. Мы различаем функции, генерирующие гипотезы на основе данных HS : S → H , и функции, генерирующие гипотезы на основе визуализаций H V : V → H.
Более того, взаимодействия с пользователем U Z , Z ∈ {V, H, CV, CH} являются неотъемлемой частью процесса визуальной аналитики. Взаимодействие с пользователем может либо влиять только на визуализации U V : V → V (т. е. выбор или масштабирование), либо может влиять только на гипотезы U H : H → H путем генерации новых гипотез из заданных. Более того, понимание можно сделать на основе визуализаций U CV : V → I или гипотез U CH : H → I .
Типичная предварительная обработка данных с применением функций очистки, интеграции и преобразования данных определяется как D P = D T ( DI ( DC (S 1 , ..., S n ))) . После этапа предварительной обработки либо методы автоматического анализа HS = {f s1 , ..., f sq } (т. е. статистика, интеллектуальный анализ данных и т. д.), либо методы визуализации V S : S → V, V S = {f v1 , ..., f vs } применяются к данным, чтобы выявить закономерности, как показано на рисунке выше. [7]
Обычно для обработки данных используется следующая парадигма:
Сначала анализируйте – покажите важное – масштабируйте, фильтруйте и анализируйте дальше – подробности по требованию [8]