stringtranslate.com

Данные подсчета

В статистике данные подсчета — это статистический тип данных , описывающий исчисляемые количества , данные , которые могут принимать только счетные числа , неотрицательные целые значения {0, 1, 2, 3, ...}, и где эти целые числа возникают в результате подсчета , а не чем рейтинг . Статистическая обработка данных подсчета отличается от обработки двоичных данных , в которых наблюдения могут принимать только два значения, обычно представленных 0 и 1, и от порядковых данных , которые также могут состоять из целых чисел, но где отдельные значения попадают в числовые значения. масштаб произволен, и важен только относительный ранжирование. [ нужен пример ]

Подсчет переменных

Отдельный фрагмент данных счетчика часто называют переменной счетчика . Когда такая переменная рассматривается как случайная величина , для представления ее распределения обычно используются пуассоновское , биномиальное и отрицательное биномиальное распределения.

Графическое исследование

Графическому исследованию данных подсчета может помочь использование преобразований данных , выбранных так, чтобы иметь свойство стабилизировать выборочную дисперсию. В частности, преобразование квадратного корня можно использовать, когда данные могут быть аппроксимированы распределением Пуассона (хотя другие преобразования имеют несколько улучшенные свойства), тогда как обратное синусоидальное преобразование доступно, когда предпочтительнее биномиальное распределение .

Связь данных подсчета с другими переменными

Здесь переменная count будет рассматриваться как зависимая переменная . Статистические методы, такие как метод наименьших квадратов и дисперсионный анализ, предназначены для работы с непрерывными зависимыми переменными. Их можно адаптировать для работы с данными подсчета, используя преобразования данных , такие как преобразование квадратного корня , но такие методы имеют несколько недостатков; они в лучшем случае приблизительны и оценивают параметры , которые часто трудно интерпретировать.

Распределение Пуассона может служить основой для некоторого анализа данных подсчета, и в этом случае можно использовать регрессию Пуассона . Это частный случай класса обобщенных линейных моделей , который также содержит конкретные формы модели, способные использовать биномиальное распределение ( биномиальная регрессия , логистическая регрессия ) или отрицательное биномиальное распределение , когда предположения модели Пуассона нарушаются, в частности, когда диапазон значений счетчика ограничен или имеется избыточная дисперсия .

Смотрите также

дальнейшее чтение