stringtranslate.com

Радарная диаграмма

Пример звездного графика от NASA, в центре которого представлены некоторые из наиболее желательных результатов проектирования
Эта диаграмма-паук отображает выделенный бюджет в сравнении с фактическими расходами для данной организации.

Радарная диаграмма — это графический метод отображения многомерных данных в виде двумерной диаграммы из трех или более количественных переменных, представленных на осях, начинающихся из одной и той же точки. Относительное положение и угол осей обычно неинформативны, но различные эвристики, такие как алгоритмы, которые отображают данные как максимальную общую площадь, могут быть применены для сортировки переменных (осей) в относительные положения, которые показывают различные корреляции, компромиссы и множество других сравнительных мер. [1]

Радарная диаграмма также известна как веб-диаграмма , паучья диаграмма , паутинный график , паутинная диаграмма , звездная карта , [2] звездный график , паутинная диаграмма , неправильный многоугольник , полярная диаграмма или диаграмма Кивиата . [3] [4] Она эквивалентна графику в параллельных координатах , оси которого расположены радиально.

Обзор

Радарная диаграмма — это диаграмма и/или график , состоящий из последовательности равноугольных спиц, называемых радиусами, где каждая спица представляет одну из переменных. Длина данных спицы пропорциональна величине переменной для точки данных относительно максимальной величины переменной по всем точкам данных. Проводится линия, соединяющая значения данных для каждой спицы. Это придает графику звездообразный вид и происхождение одного из популярных названий для этого графика. Звездный график можно использовать для ответа на следующие вопросы: [5]

Радарные диаграммы являются полезным способом отображения многомерных наблюдений с произвольным числом переменных. [6] Каждая звезда представляет одно наблюдение. Обычно радарные диаграммы создаются в формате многослойных диаграмм с множеством звезд на каждой странице, и каждая звезда представляет одно наблюдение. [5] Звездный график был впервые использован Георгом фон Майром в 1877 году. [7] [8] Радарные диаграммы отличаются от глифовых диаграмм тем, что все переменные используются для построения нанесенной звездной фигуры. Нет разделения на переменные переднего плана и фона. Вместо этого звездообразные фигуры обычно располагаются в прямоугольном массиве на странице. Несколько легче увидеть закономерности в данных, если наблюдения расположены в некотором непроизвольном порядке (если переменные назначены лучам звезды в некотором осмысленном порядке). [9]

Приложения

Статистика отбивания Сёхея Отани против средней статистики отбивания MLB
Радарная диаграмма, показывающая статистику отбивания в сезоне MLB 2021 года. Шоехи Охтани, зеленый, превосходит DH, красный, и MLB, синий, по средним показателям за этот сезон, но также чаще выбивает мяч. Данные с https://www.baseball-reference.com/.

Радарные диаграммы могут использоваться в спорте для составления диаграмм сильных и слабых сторон игроков [10] путем вычисления различных статистических данных, связанных с игроком, которые можно отслеживать вдоль центральной оси диаграммы. Примерами служат броски, подборы, передачи и т. д. баскетболиста или статистика отбивания или подачи бейсболиста. Это создает централизованную визуализацию сильных и слабых сторон игрока, и при наложении на статистику других игроков или средние показатели лиги может показать, где игрок преуспевает и где он может улучшиться. [11] Эти знания о сильных и слабых сторонах игроков могут оказаться решающими для развития игрока, поскольку они позволяют тренерам и инструкторам корректировать режим тренировок игрока, чтобы помочь улучшить его слабые стороны. Результаты радарной диаграммы также могут быть полезны в ситуативной игре. Если отбивающий плохо отбивает против питчера-левши, то его команда знает, что ему следует ограничить количество выходов на биту против питчеров-левшей, в то время как команда соперника может попытаться создать ситуацию, в которой отбивающий будет вынужден отбивать против питчера.

Показатели производительности 3 различных типов транспортных средств
Радарная диаграмма, показывающая разницу в показателях производительности седана, спортивного автомобиля и пикапа.

Другое применение лепестковых диаграмм — контроль улучшения качества для отображения показателей производительности различных объектов, включая компьютерные программы, [12] компьютеры, телефоны, транспортные средства и многое другое. Программисты часто используют аналитику для проверки производительности своих программ по сравнению с другими. Примером этого, где лепестковые диаграммы могут быть полезны, является анализ производительности различных алгоритмов сортировки. Программист может собрать несколько различных алгоритмов сортировки, таких как выбор, пузырьковый и быстрый, затем проанализировать производительность этих алгоритмов, измерив их скорость, использование памяти и энергопотребление, затем изобразить их на лепестковой диаграмме, чтобы увидеть, как каждая сортировка работает при различных размерах данных. Другое применение производительности — измерение производительности похожих автомобилей по сравнению друг с другом. Потребитель может посмотреть на такие переменные, как максимальная скорость автомобилей, мили на галлон, лошадиные силы и крутящий момент. Затем, после использования лепестковой диаграммы для визуализации данных, они могут решить, какой автомобиль лучше всего подходит для них, основываясь на результатах.

Радарная диаграмма, показывающая сходство двух сообществ, состоящих из связанных геномных окон; см. картирование архитектуры генома .

Радарные диаграммы могут использоваться в науках о жизни для отображения сильных и слабых сторон лекарств и других лекарственных средств. [13] Используя пример двух антидепрессантов, исследователь может ранжировать переменные, такие как эффективность, побочные эффекты, стоимость и т. д. по шкале от одного до десяти. Затем они могут графически отобразить результаты с помощью радарной диаграммы, чтобы увидеть разброс переменных и выяснить, как они различаются, например, один антидепрессант дешевле и действует быстрее, но не оказывает большого облегчения с течением времени. В то же время другой антидепрессант обеспечивает более сильное облегчение и лучше держится с течением времени, но стоит дороже. Другое применение в науках о жизни — анализ пациентов. Радарные диаграммы могут использоваться для графического отображения переменных жизни, влияющих на благополучие человека, а затем анализироваться, чтобы помочь ему. Более конкретный пример — это спортсмены, чьи различные привычки в области здоровья, такие как сон, диета и стресс, отслеживаются, чтобы убедиться, что они остаются в пиковой физической форме. [14] Если какие-либо области будут показаны как просевшие, врачи и тренеры могут вмешаться, чтобы помочь спортсмену и улучшить его благополучие.

Ограничения

Радарные диаграммы в первую очередь подходят для наглядной демонстрации выбросов и общности , или когда одна диаграмма больше по каждой переменной, чем другая, и в основном используются для порядковых измерений , когда каждая переменная соответствует «лучшему» в каком-то отношении, и все переменные находятся на одной шкале.

Напротив, лепестковые диаграммы подвергались критике как плохо подходящие для принятия компромиссных решений – когда одна диаграмма больше другой по одним переменным, но меньше по другим. [15]

Кроме того, сложно визуально сравнивать длины разных спиц, поскольку радиальные расстояния трудно оценить, хотя концентрические круги помогают в качестве линий сетки. Вместо этого можно использовать простой линейный график, особенно для временных рядов. [16]

Радарные диаграммы могут в некоторой степени искажать данные, особенно когда области заполнены, поскольку содержащаяся площадь становится пропорциональной квадрату линейных мер. Например, в диаграмме с 5 переменными, которые находятся в диапазоне от 1 до 100, площадь, содержащаяся в многоугольнике, ограниченном 5 точками, когда все меры равны 90, более чем на 10% больше, чем та же область для диаграммы со всеми значениями 82.

Лепестковые диаграммы также могут стать сложными для визуального сравнения разных образцов на диаграмме, когда их значения близки, а их линии или области перетекают друг в друга, как показано на рисунке 5.

Искусственное сооружение

Радарные диаграммы накладывают на данные несколько структур, которые часто являются искусственными:

Например, чередование данных 9, 1, 9, 1, 9, 1 дает пиковую лепестковую диаграмму (которая то появляется, то исчезает), в то время как переупорядочение данных как 9, 9, 9, 1, 1, 1 вместо этого дает два отдельных клина (сектора).

В некоторых случаях существует естественная структура, и лепестковые диаграммы могут быть хорошо подходящими. Например, для диаграмм данных, которые изменяются в течение 24-часового цикла, почасовые данные естественным образом связаны со своим соседом и имеют циклическую структуру, поэтому их можно естественным образом отображать в виде лепестковой диаграммы. [16] [19] [20]

Один из наборов рекомендаций по использованию радарных карт (или, скорее, тесно связанных с ними «диаграмм полярной области») выглядит следующим образом: [20]

Размер набора данных

Радарные диаграммы полезны для многомерных наборов данных небольшого и среднего размера . Их основной недостаток в том, что их эффективность ограничена наборами данных с количеством точек менее нескольких сотен. После этого они, как правило, становятся подавляющими. [5]

Кроме того, при использовании лепестковых диаграмм с несколькими измерениями или выборками лепестковая диаграмма может стать загроможденной и ее будет сложнее интерпретировать по мере увеличения количества выборок.

Например, возьмем таблицу статистики отбивания, сравнивающую MVP MLB 2021 года Шохея Охтани со статистикой средних назначенных отбивающих лиги и некоторых игроков Зала славы. Эта статистика представляет собой процент хитов, хоумранов, страйкаутов и т. д. на отбивание игрока. Для получения дополнительной информации о том, что представляет собой каждая статистика, используемая в таблице, вы можете обратиться к этой ссылке MLB. [21] Мы будем использовать эту таблицу ниже для создания диаграмм Radar, сравнивающих статистику отбивания MVP 2021 года со средними показателями лиги для назначенных отбивающих и обычных отбивающих, в попытке визуализировать показатели производительности и визуально прийти к выводу, что Шохей превзошел среднего игрока. Затем мы включим дополнительные образцы в диаграмму Radar, используя игроков Зала славы Джеки Робинсона, Джима Тома и Фрэнка Томаса, чтобы сравнить Шохея с несколькими величайшими отбивающими всех времен. Эта диаграмма «Радар» не только может дать нам интуитивное представление о том, как Шохей соотносится с лучшими историческими игроками, но и послужит для демонстрации ограничений, связанных с наличием слишком большого количества образцов на диаграмме «Радар».

На рисунке 10 мы видим, как можно легко интерпретировать лепестковую диаграмму, когда число спиц и образцов относительно невелико. Когда мы сравниваем больше образцов на рисунке 11, даже без заполнения области на лепестковой диаграмме, становится очевидным, насколько сложно может стать интерпретация или принятие компромиссных решений.

Пример

Деталь звездного сюжета Cadillac Seville

Диаграмма справа [5] содержит звездные диаграммы 15 автомобилей . Список переменных для примера звездного графика:

  1. Цена
  2. Пробег (миль на галлон)
  3. Отчет о ремонте 1978 года (1 = худший, 5 = лучший)
  4. Отчет о ремонте 1977 года (1 = худший, 5 = лучший)
  5. Высота над головой
  6. Место для задних сидений
  7. Багажное отделение
  8. Масса
  9. Длина

Мы можем рассматривать эти графики по отдельности или использовать их для идентификации кластеров автомобилей со схожими характеристиками. Например, мы можем посмотреть на звездный график Cadillac Seville (последний на изображении) и увидеть, что это один из самых дорогих автомобилей, у него ниже среднего расход топлива (но не худший), средняя история ремонта, средняя или выше среднего вместительность и размер. Затем мы можем сравнить модели Cadillac (последние три графика) с моделями AMC (первые три графика). Это сравнение показывает различные закономерности. Модели AMC, как правило, недорогие, имеют расход топлива ниже среднего, небольшие как по высоте и весу, так и по вместительности. Модели Cadillac дорогие, имеют низкий расход топлива, большие как по размеру, так и по вместительности. [5]

Альтернативы

Для временных рядов и других данных можно использовать линейные графики [16] в виде параллельных координат .

Для графического качественного сравнения двумерных табличных данных по нескольким переменным распространенной альтернативой являются шары Харви , которые широко используются в Consumer Reports . [22] Сравнение в шарах Харви (и лепестковых диаграммах) может быть значительно упрощено путем упорядочивания переменных алгоритмически для добавления порядка. [23]

Превосходный способ визуализации структур многомерных данных — это анализ главных компонент (PCA).

Другой альтернативой является использование небольших встроенных столбчатых диаграмм, которые можно сравнить со спарклайнами . [23]

Хотя радарные и полярные карты часто описываются как один и тот же тип карт [4] , некоторые источники проводят между ними различие и даже считают радарную карту разновидностью полярной карты, которая не отображает данные в терминах полярных координат. [24]

Смотрите также

Ссылки

Общественное достояние В статье использованы материалы, являющиеся общественным достоянием Национального института стандартов и технологий.

  1. ^ Портер, Майкл М.; Никсиар, Пуйя (2018). «Многомерная механика: Картографирование производительности естественных биологических систем с использованием переставленных радарных диаграмм». PLOS ONE . 13 (9): e0204309. Bibcode : 2018PLoSO..1304309P. doi : 10.1371/journal.pone.0204309 . PMC  6161877. PMID  30265707 .
  2. ^ Нэнси Р. Тейг (2005) Набор инструментов качества . стр. 437.
  3. ^ Kolence, Kenneth W. (1973). "The Software Empiricist". ACM SIGMETRICS Performance Evaluation Review . 2 (2): 31–36. doi : 10.1145/1113644.1113647 . S2CID  18600391. Доктор Филип Дж. Кивиат на недавнем семинаре NBS/ACM по измерению производительности предположил, что круговой график, использующий радиусы в качестве переменных осей, может быть полезной формой. […] Я рекомендую называть их "графиками Кивиата" или "графиками Кивиата", чтобы признать его понимание их важности.
  4. ^ ab "Find Content Gaps Using Radar Charts". Семинары по контент-стратегии. 3 марта 2015 г. Получено 17 декабря 2015 г.
  5. ^ abcdef NIST/SEMATECH (2003). Звездный график в: e-Handbook of Statistical Methods . 6/01/2003 (Дата создания)
  6. ^ Чемберс, Джон, Уильям Кливленд, Бит Кляйнер и Пол Тьюки, (1983). Графические методы анализа данных . Уодсворт. С. 158–162
  7. ^ Майр, Георг фон (1877), Die Gesetzmäßigkeit im Gesellschaftsleben (на немецком языке), Мюнхен: Ольденбург, OL  23294909M, стр.78. Linien-Diagramme im Kreise: Линейные диаграммы в кругах.
  8. ^ Майкл Френдли (2008). «Вехи в истории тематической картографии, статистической графики и визуализации данных» Архивировано 26 сентября 2018 г. на Wayback Machine .
  9. ^ Майкл Френдли (1991). "Статистическая графика для многомерных данных". Доклад, представленный на конференции SAS SUGI 16, апрель 1991 г.
  10. ^ Паукообразные графики: диаграммы баскетбольной статистики
  11. ^ Видение данных. «Осмысление визуализаций данных». Видение данных.
  12. ^ Рон Басу (2004). Внедрение качества: практическое руководство по инструментам и методам . стр. 131.
  13. ^ Центр перевода знаний по системам моделирования. "Эффективное использование радиальных диаграмм" (PDF) . Центр перевода знаний по системам моделирования.
  14. ^ Джон Магуайр. «Денормализованные графики Spider и Radar». Kitman Labs.
  15. ^ Вы НЕ человек-паук, так почему же вы используете радужные диаграммы?, Chandoo, 18 сентября 2008 г.
  16. ^ abc Пельтье, Джон (2008-08-14). "Rock Around The Clock - Peltier Tech Blog". Peltiertech.com . Получено 2013-09-11 .
  17. ^ Кливленд, Уильям; Макгилл, Роберт (1984). «Графическое восприятие: теория, эксперименты и применение к разработке графических методов». Журнал Американской статистической ассоциации . 79 (387): 531–554. JSTOR  2288400.Краткое изложение иерархии Кливленда
  18. ^ Кливленд и Макгилл 1984 (обобщенно)
  19. ^ "Диаграммы круглосуточно. Блог диаграмм Excel". Excelcharts.com. 2008-08-15 . Получено 2013-09-11 .
  20. ^ ab Часы Это
  21. ^ "Standard Stats". www.mlb.com . Получено 2022-04-26 .
  22. ^ "Качественное сравнение". Блог Support Analytics . 11 декабря 2007 г. Архивировано из оригинала 2012-04-08.
  23. ^ ab "Информационный океан: Переупорядочиваемые таблицы II: Бертин против пауков". I-ocean.blogspot.com. 2008-09-24 . Получено 2013-09-11 .
  24. ^ "Polar Charts (Report Builder and SSRS)". Microsoft Developer Network . Получено 17 декабря 2015 г.

Внешние ссылки