stringtranslate.com

Рейтинг

Ранжирование — это отношение между набором элементов, часто записанное в списке , так что для любых двух элементов первый либо «ранжирован выше», либо «ранжирован ниже», либо «ранжирован равным» второму. [1] В математике это известно как слабый порядок или полный предварительный порядок объектов. Это не обязательно полный порядок объектов, поскольку два разных объекта могут иметь одинаковый ранг. Сами ранги полностью упорядочены. Например, материалы полностью предупорядочены по твердости , в то время как степени твердости полностью упорядочены. Если два элемента имеют одинаковый ранг, это считается ничьей.

Сводя подробные меры к последовательности порядковых чисел , ранжирование позволяет оценивать сложную информацию в соответствии с определенными критериями. [2] Так, например, поисковая система в Интернете может ранжировать найденные страницы в соответствии с оценкой их релевантности , что позволяет пользователю быстро выбирать страницы, которые он, скорее всего, захочет просмотреть.

Анализ данных, полученных путем ранжирования, обычно требует непараметрической статистики .

Стратегии решения проблем

Не всегда возможно назначать рейтинги однозначно. Например, в гонке или соревновании два (или более) участника могут претендовать на одно место в рейтинге. [3] При вычислении порядкового измерения две (или более) ранжируемых величин могут иметь одинаковые значения. В этих случаях может быть принята одна из стратегий, приведенных ниже, для назначения рейтингов.

Обычный сокращенный способ различения этих стратегий ранжирования — это ранговые номера, которые будут получены для четырех элементов, при этом первый элемент ранжируется выше второго и третьего (которые сравниваются одинаково), которые оба ранжируются выше четвертого. [4] Эти названия также показаны ниже.

Стандартный рейтинг соревнований (рейтинг «1224»)

В рейтинге соревнований элементы, которые сравниваются как равные, получают одинаковый номер рейтинга, а затем в рейтинговых числах остается пробел. Количество номеров рейтинга, которые остаются в этом пробеле, на единицу меньше, чем количество элементов, которые сравниваются как равные. Эквивалентно, номер рейтинга каждого элемента равен 1 плюс количество элементов, расположенных выше него. Эта стратегия ранжирования часто применяется для соревнований, поскольку она означает, что если два (или более) участника разделяют позицию в рейтинге, позиция всех тех, кто находится ниже них, не влияет (т. е. участник занимает второе место, только если ровно один человек набирает больше очков, чем он, третье, если ровно два человека набирают больше очков, чем он, четвертое, если ровно три человека набирают больше очков, чем он, и т. д.).

Таким образом, если A занимает место выше B и C (которые равны по рангу), которые оба занимают место выше D, то A получает ранговый номер 1 («первый»), B получает ранговый номер 2 («второй по счету»), C также получает ранговый номер 2 («второй по счету»), а D получает ранговый номер 4 («четвертый»).

Этот метод называется «Low» в IBM SPSS [5] и «min» в языке программирования R [6] в их методах обработки ничьих.

Измененный рейтинг соревнований (рейтинг «1334»)

Иногда рейтинг соревнований составляется путем оставления пробелов в рейтинговых числах перед наборами элементов с равным рейтингом (а не после них, как в стандартном рейтинге соревнований). Количество рейтинговых чисел, оставленных в этом пробеле, остается на единицу меньше количества элементов, которые сравнивались равными. Эквивалентно, рейтинг каждого элемента равен количеству элементов, имеющих равный или более высокий рейтинг. Такой рейтинг гарантирует, что участник займет второе место, только если он наберет больше очков, чем все, кроме одного, его соперники, третье место, если он наберет больше очков, чем все, кроме двух, его соперники, и т. д.

Таким образом, если A занимает место выше B и C (которые сравниваются одинаково), которые оба занимают место выше D, то A получает номер рейтинга 1 («первый»), B получает номер рейтинга 3 («совместный третий»), C также получает номер рейтинга 3 («совместный третий»), а D получает номер рейтинга 4 («четвертый»). В этом случае никто не получит номер рейтинга 2 («второй»), и это будет оставлено как пробел.

Этот метод называется «High» в IBM SPSS [5] и «max» в языке программирования R [6] в их методах обработки ничьих.

Плотный рейтинг (рейтинг «1223»)

В плотном ранжировании элементы, которые сравниваются одинаково, получают одинаковый номер ранга, а следующие элементы получают непосредственно следующий номер ранга. Эквивалентно, номер ранга каждого элемента равен 1 плюс количество элементов, расположенных выше него, которые отличаются относительно порядка ранга.

Таким образом, если A занимает место выше B и C (которые в сравнении равны), которые оба занимают место выше D, то A получает рейтинговое число 1 («первое»), B получает рейтинговое число 2 («совместное второе»), C также получает рейтинговое число 2 («совместное второе»), а D получает рейтинговое число 3 («третье»).

Этот метод называется «последовательным» в IBM SPSS [5] и «плотным» в языке программирования R [7] в их методах обработки связей.

Порядковый рейтинг (рейтинг «1234»)

В порядковом ранжировании все элементы получают различные порядковые номера, включая элементы, которые сравниваются как равные. Присвоение различных порядковых номеров элементам, которые сравниваются как равные, может быть сделано случайным образом или произвольно, но обычно предпочтительнее использовать произвольную, но последовательную систему, поскольку это дает стабильные результаты, если ранжирование выполняется несколько раз. Примером произвольной, но последовательной системы может быть включение других атрибутов в порядок ранжирования (например, алфавитный порядок имени участника), чтобы гарантировать, что никакие два элемента не будут точно совпадать.

При использовании этой стратегии, если A занимает более высокое место, чем B и C (которые равны по рангу), которые оба занимают более высокое место, чем D, то A получает ранг 1 («первый»), а D получает ранг 4 («четвертый»), и либо B получает ранг 2 («второй»), а C получает ранг 3 («третий»), либо C получает ранг 2 («второй»), а B получает ранг 3 («третий»).

В компьютерной обработке данных порядковый ранжирование также называется «нумерацией строк».

Этот метод соответствует методам «first», «last» и «random» в языке программирования R [6] для обработки ничьих.

Дробное ранжирование (ранжирование «1 2,5 2,5 4»)

Элементы, которые сравниваются как равные, получают одинаковый номер ранга, который является средним значением того, что они имели бы при порядковом ранжировании; эквивалентно, номер ранга 1 плюс количество элементов, ранжированных выше него, плюс половина количества элементов, равных ему. Эта стратегия имеет свойство, что сумма номеров ранга такая же, как при порядковом ранжировании. По этой причине она используется при вычислении счетчиков Борда и в статистических тестах (см. ниже).

Таким образом, если A занимает место выше B и C (которые в сравнении равны), которые оба занимают место выше D, то A получает рейтинговое число 1 («первое»), B и C получают рейтинговое число 2,5 (среднее значение «совместного второго/третьего»), а D получает рейтинговое число 4 («четвертое»).

Вот пример: предположим, у вас есть набор данных 1.0, 1.0, 2.0, 3.0, 3.0, 4.0, 5.0, 5.0, 5.0.

Порядковые ранги: 1, 2, 3, 4, 5, 6, 7, 8, 9.

Для v = 1,0 дробный ранг равен среднему значению порядковых рангов: (1 + 2) / 2 = 1,5. Аналогичным образом, для v = 5,0 дробный ранг равен (7 + 8 + 9) / 3 = 8,0.

Таким образом, дробные ранги следующие: 1,5, 1,5, 3,0, 4,5, 4,5, 6,0, 8,0, 8,0, 8,0.

Этот метод называется «Mean» в IBM SPSS [5] и «average» в языке программирования R [6] в их методах обработки совпадений.

Статистика

В статистике ранжирование — это преобразование данных , при котором числовые или порядковые значения заменяются их рангом при сортировке данных.

Например, если наблюдаются числовые данные 3.4, 5.1, 2.6, 7.3, то ранги этих элементов данных будут 2, 3, 1 и 4 соответственно.

В качестве другого примера порядковые данные «горячий», «холодный», «теплый» будут заменены на 3, 1, 2. В этих примерах ранги присваиваются значениям в порядке возрастания, хотя можно использовать и убывающие ранги.

Ранги связаны с индексированным списком порядковых статистик , который состоит из исходного набора данных, упорядоченного в порядке возрастания.

Спорт

Частичный вид на стадион «Зеленый монстр» в Фенуэй-парке с турнирной таблицей дивизиона Американской лиги Востока по итогам сезона Главной лиги бейсбола 2007 года.
В спорте турнирные таблицы , рейтинги или таблицы лиг группируют команды определенной лиги, конференции или дивизиона в таблице на основе того, насколько хорошо каждая из них выступила в определенном сезоне спортивной лиги или соревнования. Эти списки обычно публикуются в газетах и ​​других средствах массовой информации, а также на официальных веб-сайтах спортивных лиг и соревнований.

Образование

Таблицы рейтингов используются для сравнения академических достижений различных учреждений. Рейтинги колледжей и университетов ранжируют учреждения высшего образования по сочетаниям факторов. Помимо целых учреждений, ранжируются конкретные программы, факультеты и школы. Эти рейтинги обычно проводятся журналами, газетами, правительствами и учеными. Например, таблицы рейтингов британских университетов ежегодно публикуются The Independent , The Sunday Times и The Times . [8] Основная цель этих рейтингов — информировать потенциальных абитуриентов о британских университетах на основе ряда критериев. Аналогичным образом, в таких странах, как Индия, разрабатываются таблицы рейтингов, и популярный журнал Education World опубликовал их на основе данных с TheLearningPoint.net . [ требуется ссылка ]

Жалобы на то, что ранжирование школ Англии по жестким правилам, не учитывающим более широкие социальные условия, на самом деле делает несостоятельные школы еще хуже. Это происходит потому, что наиболее заинтересованные родители затем избегают таких школ, оставляя только детей неамбициозных родителей. [9]

Бизнес

В бизнесе рейтинговые таблицы содержат список лидеров деловой активности в определенной отрасли, ранжируя компании на основе различных критериев, включая выручку, прибыль и другие соответствующие ключевые показатели эффективности (такие как доля рынка и соответствие ожиданиям клиентов), что позволяет людям быстро анализировать важные данные. [10]

Приложения

Методология ранжирования, основанная на некоторых конкретных индексах, является одной из наиболее распространенных систем, используемых политиками и международными организациями для оценки социально-экономического контекста стран. Некоторые известные примеры включают Индекс развития человеческого потенциала (Организация Объединенных Наций), Индекс ведения бизнеса ( Всемирный банк ), Индекс восприятия коррупции (Transparency International) и Индекс экономической свободы (Heritage Foundation). Например, Индикатор ведения бизнеса Всемирного банка измеряет правила ведения бизнеса и их применение в 190 странах. Страны ранжируются по десяти показателям, которые синтезируются для получения окончательного рейтинга. Каждый показатель состоит из подпоказателей; например, Индикатор регистрации собственности состоит из четырех подпоказателей, измеряющих время, процедуры, затраты и качество системы регистрации земли. Эти виды рангов основаны на субъективных критериях для присвоения баллов. Иногда принятые параметры могут приводить к расхождениям с эмпирическими наблюдениями, поэтому при применении этих критериев могут возникать потенциальные предубеждения и парадоксы. [11]

Другие примеры

Смотрите также

Ссылки

  1. ^ «Определение РЕЙТИНГА».
  2. ^ Малара, Збигнев; Мишко, Рафал; Сулич, Адам. «Карьерный путь выпускников Вроцлавского политехнического университета». {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  3. ^ Сулич, Адам. "Рынок труда молодежи и кризис интеграции в Европейском Союзе" . Получено 2017-03-04 .
  4. ^ "The Data School - Как ранжировать по группам в Alteryx - Часть 1 - Стандартное соревнование, плотное, порядковое ранжирование". www.thedataschool.co.uk . Получено 23 июля 2023 г.
  5. ^ abcd "Rank Cases: Ties". www.ibm.com . Получено 2023-07-23 .
  6. ^ abcd "rank function - RDocumentation". www.rdocumentation.org . Получено 2023-07-23 .
  7. ^ "R: Fast Sample Ranks". search.r-project.org . Получено 2023-07-23 .
  8. ^ "Рейтинги университетов Соединенного Королевства", Википедия , 2024-06-05 , получено 2024-06-15
  9. ^ Крис Робертс, Тяжелые слова, брошенные легко: Причина возникновения рифмы, Thorndike Press, 2006 ( ISBN 0-7862-8517-6
  10. ^ Business Ranking Annual . Gale Research International, Limited. Октябрь 2000. С. 740. ISBN 9780787640255.
  11. ^ RIEDS, Italian Review of Economics Demography and Statistics (2014). «Проект Всемирного банка Doing Business и статистические методы, основанные на рангах: парадокс показателя времени». Rieds - Rivista Italiana di Economia, Demografia e Statistica - итальянский журнал экономических, демографических и статистических исследований . 68 (1): 79–86.
  12. ^ Тофаллис, Крис (2022). «Многомерный рейтинг членов парламента» (PDF) . Радикальная статистика (133): 3–29.

Внешние ссылки