График — это графический метод представления набора данных , обычно в виде графика, показывающего взаимосвязь между двумя или более переменными. График может быть нарисован вручную или с помощью компьютера. В прошлом иногда использовались механические или электронные плоттеры . Графики — это визуальное представление взаимосвязи между переменными, которое очень полезно для людей, которые затем могут быстро получить понимание, которое, возможно, не пришло из списков значений. При наличии масштаба или линейки графики также можно использовать для считывания значения неизвестной переменной, нанесенной на график как функции известной, но это также можно сделать с данными, представленными в табличной форме. Графики функций используются в математике , науках , технике , технологиях , финансах и других областях.
Обзор
Графики играют важную роль в статистике и анализе данных . Процедуры здесь можно в целом разделить на две части: количественные и графические. Количественные методы представляют собой набор статистических процедур, которые дают числовой или табличный вывод. Примеры количественных методов включают: [1]
Эти и подобные методы все ценны и являются основными в классическом анализе. Существует также много статистических инструментов, которые обычно называют графическими методами. К ним относятся: [1]
Графические процедуры, такие как графики, являются коротким путем к получению понимания набора данных с точки зрения проверки предположений, выбора модели, проверки модели, выбора оценщика, идентификации взаимосвязи, определения факторного эффекта, обнаружения выбросов. Статистическая графика дает понимание аспектов базовой структуры данных. [1]
Биплот : это тип графика, используемый в статистике. Биплот позволяет графически отображать информацию как по образцам, так и по переменным матрицы данных. Образцы отображаются в виде точек, а переменные отображаются либо в виде векторов, линейных осей, либо нелинейных траекторий. В случае категориальных переменных точки уровня категории могут использоваться для представления уровней категориальной переменной. Обобщенный биплот отображает информацию как по непрерывным, так и по категориальным переменным.
График Бланда–Альтмана : в аналитической химии и биостатистике этот график представляет собой метод построения графика данных , используемый при анализе соответствия между двумя различными анализами . Он идентичен графику средней разности Тьюки , который до сих пор известен как в других областях, но был популяризирован в медицинской статистике Бландом и Альтманом. [2] [3]
Ящичная диаграмма : в описательной статистике ящичная диаграмма, также известная как диаграмма или график «ящик с усами», является удобным способом графического изображения групп числовых данных с помощью их пятичислового резюме (наименьшее наблюдение, нижний квартиль (Q1), медиана (Q2), верхний квартиль (Q3) и наибольшее наблюдение). Ящичная диаграмма также может указывать, какие наблюдения, если таковые имеются, можно считать выбросами.
Ковровая диаграмма : двумерный график, иллюстрирующий взаимодействие между двумя-тремя независимыми переменными и одной-тремя зависимыми переменными.
Диаграмма «Комета»: двух- или трехмерный анимированный график, на котором точки данных отслеживаются на экране.
Контурный график : Двумерный график, показывающий одномерные кривые, называемые контурными линиями , на которых нанесенная величина q является константой. При желании нанесенные значения могут быть закодированы цветом.
Диаграмма Далица : это диаграмма рассеяния, часто используемая в физике элементарных частиц для представления относительной частоты различных (кинематически различных) способов, которыми продукты определенных (в остальном схожих) трехчастичных распадов могут разъезжаться.
Drain plot: Двумерный график, где данные представлены в иерархии с несколькими уровнями. Уровни вложены в том смысле, что части в каждой круговой диаграмме в сумме составляют 100%. Метафора водопада или капли воды используется для связи каждого слоя с нижним, визуально передавая иерархическую структуру. Drain Plot . [4]
Funnel plot : Это полезный график, разработанный для проверки наличия публикационной ошибки в метаанализах. Funnel plot, представленные Light и Pillemer в 1994 году [6] и подробно обсуждаемые Egger и коллегами [7] , являются полезными дополнениями к метаанализам. Funnel plot — это диаграмма рассеяния эффекта лечения в зависимости от меры размера исследования. Она используется в первую очередь как визуальное средство для обнаружения ошибки или систематической гетерогенности .
Точечный график (статистика) : Точечный график или точечный график — это статистическая диаграмма, состоящая из группы точек данных, нанесенных на простую шкалу. Точечные графики используются для непрерывных , количественных , одномерных данных. Точки данных могут быть помечены, если их немного. Точечные графики — одни из самых простых доступных графиков, и подходят для наборов данных небольшого и среднего размера. Они полезны для выделения кластеров и пробелов, а также выбросов .
Лесная диаграмма : графическое отображение, показывающее силу доказательств в количественных научных исследованиях. Она была разработана для использования в медицинских исследованиях как средство графического представления метаанализа результатов рандомизированных контролируемых испытаний . За последние двадцать лет аналогичные метааналитические методы применялись в наблюдательных исследованиях (например, эпидемиология окружающей среды ), и лесные диаграммы также часто используются для представления результатов таких исследований.
Диаграмма Гэлбрейта : в статистике диаграмма Гэлбрейта (также известная как радиальная диаграмма Гэлбрейта или просто радиальная диаграмма) — это один из способов отображения нескольких оценок одной и той же величины, имеющих разные стандартные ошибки . [8] Ее можно использовать для изучения неоднородности в метаанализе в качестве альтернативы или дополнения к диаграмме леса .
Нормальный график вероятности : Нормальный график вероятности — это графический метод оценки того, распределен ли набор данных приблизительно нормально . Данные наносятся на график относительно теоретического нормального распределения таким образом, чтобы точки образовывали приблизительную прямую линию. Отклонения от этой прямой линии указывают на отклонения от нормальности. Нормальный график вероятности — это частный случай вероятностного графика .
График Найквиста : График используется в автоматическом управлении и обработке сигналов для оценки устойчивости системы с обратной связью . Он представлен графиком в полярных координатах, на котором нанесены коэффициент усиления и фаза частотной характеристики. График этих векторных величин показывает фазу как угол, а величину как расстояние от начала координат.
Частичный регрессионный график : В прикладной статистике частичный регрессионный график пытается показать эффект добавления другой переменной в модель (при условии, что одна или несколько независимых переменных уже есть в модели). Частичные регрессионные графики также называются графиками добавленных переменных, графиками скорректированных переменных и графиками индивидуальных коэффициентов.
График частичных остатков : в прикладной статистике график частичных остатков представляет собой графический метод, который пытается показать взаимосвязь между заданной независимой переменной и переменной отклика, при условии, что в модели также присутствуют и другие независимые переменные.
Вероятностный график : Вероятностный график — это графический метод оценки того, соответствует ли набор данных заданному распределению, например нормальному или распределению Вейбулла , а также визуальной оценки параметров местоположения и масштаба выбранного распределения. Данные наносятся на график относительно теоретического распределения таким образом, чтобы точки образовывали приблизительно прямую линию. Отклонения от этой прямой линии указывают на отклонения от указанного распределения.
График хребта : несколько линейных графиков, расположенных вертикально и слегка перекрывающих друг друга.
График рекуррентности : В описательной статистике и теории хаоса график рекуррентности (РП) — это график, показывающий для заданного момента времени моменты времени, в которые фазовое пространство . Другими словами, это график
показаны на горизонтальной оси и на вертикальной оси, где - траектория фазового пространства .
Диаграмма рассеяния : Диаграмма рассеяния или диаграмма рассеяния — это тип отображения, использующий переменные для набора данных. Данные отображаются как набор точек, каждая из которых имеет значение одной переменной, определяющей положение на горизонтальной оси, и значение другой переменной, определяющей положение на вертикальной оси. [9]
График Shmoo : В электротехнике график Shmoo — это графическое отображение реакции компонента или системы, изменяющейся в зависимости от ряда условий и входных данных. Часто используется для представления результатов тестирования сложных электронных систем, таких как компьютеры, ASIC или микропроцессоры. График обычно показывает диапазон условий, в которых будет работать тестируемое устройство .
Спагетти-диаграммы — это метод просмотра данных для визуализации возможных потоков через системы. Потоки, изображенные таким образом, выглядят как лапша, отсюда и возник этот термин. [10] Этот метод статистики впервые был использован для отслеживания маршрутизации через фабрики. Визуализация потока таким образом может снизить неэффективность в потоке системы.
Звездный график : Графический метод отображения многомерных данных. Каждая звезда представляет одно наблюдение. Обычно звездные графики создаются в формате многомерного графика с большим количеством звезд на каждой странице, и каждая звезда представляет одно наблюдение.
Поверхностный график: В этой визуализации графика двумерной функции поверхность строится так, чтобы соответствовать набору троек данных (X, Y, Z), где Z получается функцией, которую нужно построить Z=f(X, Y). Обычно набор значений X и Y равномерно распределен. При желании построенные значения могут быть закодированы цветом.
Векторные поля : диаграммы векторных полей (или диаграммы колебаний) показывают направление и силу вектора, связанного с 2D- или 3D-точками. Обычно они используются для отображения силы градиента на плоскости или поверхности.
Скрипичная диаграмма : Скрипичные диаграммы — это метод построения диаграмм числовых данных. Они похожи на диаграммы ящиков , за исключением того, что они также показывают плотность вероятности данных при различных значениях (в простейшем случае это может быть гистограмма ). Обычно скрипичные диаграммы включают маркер для медианы данных и поле, указывающее межквартильную область, как в стандартных диаграммах ящиков. На эту диаграмму ящиков накладывается оценка плотности ядра . Скрипичные диаграммы доступны в качестве расширений для ряда программных пакетов, включая R через библиотеку vioplot и Stata через надстройку vioplot. [11]
График Аррениуса : этот график сравнивает логарифм скорости реакции ( , ось ординат ), построенный против обратной температуры ( , ось абсцисс ). Графики Аррениуса часто используются для анализа влияния температуры на скорость химических реакций.
Точечный график (биоинформатика) : этот график сравнивает две биологические последовательности и является графическим методом, который позволяет идентифицировать области близкого сходства между ними. Это своего рода график повторения .
График Лайнуивера–Берка : этот график сравнивает обратные величины скорости реакции и концентрации субстрата. Он используется для представления и определения кинетики фермента .
Типы графиков и их применение очень сильно различаются. Вот несколько типичных примеров:
Простой график: Кривые спроса и предложения , простые графики, используемые в экономике для связи спроса и предложения с ценой. Графики могут использоваться вместе для определения экономического равновесия (по сути, для решения уравнения).
Простой график, используемый для считывания значений: колоколообразное нормальное или гауссовское распределение вероятностей , из которого, например, можно вывести вероятность того, что рост мужчины находится в указанном диапазоне, если имеются данные для взрослого мужского населения.
Очень сложный график: психрометрическая диаграмма , связывающая температуру, давление, влажность и другие величины.
Непрямоугольные координаты: все вышеперечисленные используют двумерные прямоугольные координаты ; примером графика, использующего полярные координаты , иногда в трех измерениях, является диаграмма направленности антенны , которая отображает мощность, излучаемую во всех направлениях антенной определенного типа.
^ abc NIST/SEMATECH (2003). "Роль графики". В: e-Handbook of Statistical Methods 6 января 2003 г. (Дата создания).
^ Altman DG, Bland JM (1983). «Измерение в медицине: анализ сравнительных исследований методов». The Statistician . 32 (3). Blackwell Publishing: 307–317. doi :10.2307/2987937. JSTOR 2987937.
^ Бланд Дж. М., Альтман Д. Г. (1986). «Статистические методы оценки согласия между двумя методами клинических измерений». Lancet . 1 (8476): 307–10. doi :10.1016/S0140-6736(86)90837-8. PMID 2868172. S2CID 2844897.
^ Flegel WA, Srivastava K (2024). «40 лет исследований фенотипа Del привели к изменению практики переливания крови». Transfusion . 64 (7). Wiley: 1187–1190. doi :10.1111/trf.17913.
^ ab Simionescu, PA (2014). Computer Aided Graphing and Simulation Tools for AutoCAD Users (1-е изд.). Бока-Ратон, Флорида: CRC Press. ISBN978-1-4822-5290-3.
^ RJ Light; DB Pillemer (1984). Подведение итогов: Наука рецензирования исследований . Кембридж, Массачусетс.: Издательство Гарвардского университета.
^ M. Egger , G. Davey Smith , M. Schneider & C. Minder (сентябрь 1997 г.). «Смещение в метаанализе, обнаруженное простым графическим тестом». BMJ . 315 (7109): 629–634. doi :10.1136/bmj.315.7109.629. PMC 2127453. PMID 9310563 .{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Гэлбрейт, Рекс (1988). «Графическое отображение оценок с различными стандартными ошибками». Технометрика . 30 (3). Американское общество качества: 271–281. doi :10.2307/1270081. JSTOR 1270081.
^ Уттс, Джессика М. Видение статистики , 3-е издание, Томсон Брукс/Коул, 2005, стр. 166–167. ISBN 0-534-39402-7
^ Теодор Т. Аллен (2010). Введение в инженерную статистику и Lean Sigma: статистический контроль качества и проектирование экспериментов и систем. Springer. стр. 128. ISBN978-1-84882-999-2. Получено 2011-02-17 .
^ Хинтце Джерри Л.; Нельсон Рэй Д. (1998). «Скрипичные диаграммы: синергизм диаграммы плотности ящиков». Американский статистик . 52 (2): 181–84. doi :10.1080/00031305.1998.10480559.
Внешние ссылки
На Викискладе есть медиафайлы по теме «Участки» .
Галерея данных некоторых полезных графических методов на сайте itl.nist.gov.