Ранжирование — это такое отношение между набором элементов, при котором для любых двух элементов первый имеет либо «ранг выше», «ранг ниже», либо «ранг, равный» второму . [1] В математике это известно как слабый порядок или полный предварительный порядок объектов. Это не обязательно полный порядок объектов, поскольку два разных объекта могут иметь одинаковый рейтинг. Сами рейтинги полностью упорядочены. Например, материалы полностью упорядочены по твердости , а степени твердости полностью упорядочены. Если два предмета имеют одинаковый ранг, это считается ничьей.
Сводя детальные меры к последовательности порядковых чисел , рейтинги позволяют оценивать сложную информацию по определенным критериям. [2] Так, например, поисковая система Интернета может ранжировать найденные ею страницы в соответствии с оценкой их релевантности , давая пользователю возможность быстро выбирать страницы, которые он, скорее всего, захочет увидеть.
Анализ данных, полученных путем ранжирования, обычно требует непараметрической статистики .
Не всегда возможно однозначно присвоить рейтинги. Например, в гонке или соревновании два (или более) участника могут иметь равные места в рейтинге. [3] При вычислении порядкового измерения две (или более) ранжируемых величин могут иметь одинаковые значения. В этих случаях может быть принята одна из приведенных ниже стратегий присвоения рейтингов.
Распространенный сокращенный способ отличить эти стратегии ранжирования - это ранжирующие числа, которые будут получены для четырех элементов, при этом первый элемент будет ранжироваться выше второго и третьего (которые сравниваются одинаково), которые оба имеют рейтинг выше четвертого. [4] Эти имена также показаны ниже.
В рейтинге соревнований элементы, которые сравниваются равными, получают один и тот же рейтинговый номер, а затем в рейтинговых числах остается пробел. Количество ранговых чисел, не учтенных в этом пробеле, на единицу меньше, чем количество элементов, которые сравниваются равными. Аналогично, рейтинг каждого элемента равен 1 плюс количество элементов, находящихся выше него. Эта стратегия ранжирования часто применяется на соревнованиях, поскольку это означает, что если два (или более) участника разделяют позиции в рейтинге, положение всех участников, находящихся ниже них, не затрагивается (т. е. участник занимает второе место только в том случае, если ровно один человек набирает больше, чем они, третье, если ровно два человека набирают больше, чем они, четвертое, если ровно три человека набирают больше, чем они, и т. д.).
Таким образом, если A опережает B и C (которые при сравнении равны), которые оба опережают D, то A получает рейтинг 1 («первый»), B получает номер 2 («совместный второй»), C также получает рейтинг. номер 2 («совместный второй»), а D получает номер 4 («четвертый»).
Этот метод называется «Low» в IBM SPSS [5] и «min» в языке программирования R [6] в их методах обработки связей.
Иногда рейтинг соревнований составляется путем оставления пробелов в рейтинговых числах перед наборами элементов одинакового рейтинга (а не после них, как в стандартном рейтинге соревнований). Количество ранговых чисел, не учтенных в этом разрыве, остается на единицу меньше, чем количество элементов, которые сравниваются равными. Аналогично, рейтинг каждого элемента равен количеству элементов, ранг которых равен ему или выше него. Этот рейтинг гарантирует, что участник занимает второе место только в том случае, если он набирает больше очков, чем все его противники, кроме одного, третье, если он набирает больше очков, чем все его оппоненты, кроме двух, и т. д.
Таким образом, если A опережает B и C (которые при сравнении равны), которые оба опережают D, то A получает рейтинг 1 («первый»), B получает номер 3 («совместное третье»), C также получает рейтинг. номер 3 («совместный третий»), а D получает номер 4 («четвертый»). В этом случае никто не получит номер 2 («второй») в рейтинге, и это останется пробелом.
Этот метод называется «High» в IBM SPSS [5] и «max» в языке программирования R [6] в их методах обработки связей.
При плотном ранжировании элементы, которые сравниваются одинаково, получают один и тот же рейтинговый номер, а следующие элементы получают следующий ранговый номер. Эквивалентно, рейтинговый номер каждого элемента равен 1 плюс количество элементов, стоящих выше него и различающихся в соответствии с порядком ранжирования.
Таким образом, если A опережает B и C (которые при сравнении равны), которые оба опережают D, то A получает рейтинг 1 («первый»), B получает номер 2 («совместно второй»), C также получает рейтинг. номер 2 («совместный второй»), а D получает номер 3 («Третий»).
Этот метод называется «последовательным» в IBM SPSS [5] и «плотным» в языке программирования R [7] в их методах обработки связей.
При порядковом ранжировании все элементы получают разные порядковые номера, включая элементы, которые сравниваются равными. Присвоение отдельных порядковых номеров элементам, которые сравниваются равными, может выполняться случайным или произвольным образом, но обычно предпочтительнее использовать произвольную, но последовательную систему, поскольку это дает стабильные результаты, если ранжирование выполняется несколько раз. Примером произвольной, но последовательной системы может быть включение других атрибутов в порядок ранжирования (например, алфавитный порядок имени участника), чтобы гарантировать, что никакие два элемента не совпадают в точности.
При использовании этой стратегии, если A опережает B и C (которые при сравнении равны), которые оба имеют рейтинг выше D, то A получает номер 1 («первый»), а D получает номер 4 («четвертый»), и либо B получает номер рейтинга 2 («второй»), а C получает номер рейтинга 3 («третий») или C получает номер рейтинга 2 («второй»), а B получает номер рейтинга 3 («третий»).
При компьютерной обработке данных порядковый номер также называют «нумерацией строк».
Этот метод соответствует «первому», «последнему» и «случайному» методам языка программирования R [6] для обработки связей.
Элементы, которые сравниваются равными, получают одинаковый ранговый номер, который является средним значением того, что они имели бы при порядковом ранжировании; эквивалентно, рейтинговый номер 1 плюс количество элементов, стоящих выше него, плюс половина количества элементов, равных ему. Эта стратегия обладает тем свойством, что сумма ранжирующих чисел такая же, как и при порядковом ранжировании. По этой причине он используется при расчете счетчиков Борда и в статистических тестах (см. Ниже).
Таким образом, если A опережает B и C (которые при сравнении равны), которые оба опережают D, то A получает ранговый номер 1 («первый»), каждый из B и C получает ранговый номер 2,5 (среднее «совместное второе/третье место»). "), а D получает номер 4 ("четвертый").
Вот пример: предположим, что у вас есть набор данных 1.0, 1.0, 2.0, 3.0, 3.0, 4.0, 5.0, 5.0, 5.0.
Порядковые ранги: 1, 2, 3, 4, 5, 6, 7, 8, 9.
При v = 1,0 дробный ранг равен среднему порядковому рангу: (1 + 2)/2 = 1,5. Аналогичным образом для v = 5,0 дробный ранг равен (7 + 8 + 9)/3 = 8,0.
Таким образом, дробные ранги таковы: 1,5, 1,5, 3,0, 4,5, 4,5, 6,0, 8,0, 8,0, 8,0.
Этот метод называется «Средним» в IBM SPSS [5] и «средним» в языке программирования R [6] в их методах обработки связей.
Таблицы рейтингов используются для сравнения академических достижений различных учебных заведений. В рейтингах колледжей и университетов высшие учебные заведения упорядочиваются по сочетанию факторов. Помимо целых учреждений, в рейтинг оцениваются конкретные программы, факультеты и школы. Эти рейтинги обычно составляют журналы, газеты, правительства и ученые. Например, рейтинговые таблицы британских университетов ежегодно публикуют The Guardian , The Independent , The Sunday Times и The Times . Основная цель этих рейтингов — информировать потенциальных абитуриентов о британских университетах на основе ряда критериев. Аналогичным образом, в таких странах, как Индия, разрабатываются рейтинговые таблицы, и популярный журнал Education World публикует их на основе данных TheLearningPoint.net . [ нужна цитата ]
Жалуются, что приведение английских школ к жестким руководящим принципам, которые не принимают во внимание более широкие социальные условия, на самом деле еще больше усугубляет неблагополучные школы. Это происходит потому, что наиболее заинтересованные родители будут избегать таких школ, оставляя посещать их только детям неамбициозных родителей. [8]
В бизнесе в рейтинговых таблицах перечисляются лидеры деловой активности в конкретной отрасли, ранжируя компании на основе различных критериев, включая выручку, прибыль и другие соответствующие ключевые показатели эффективности (такие как доля рынка и удовлетворение ожиданий клиентов), что позволяет людям быстро анализировать важные показатели. данные. [9]
Методология ранжирования, основанная на некоторых конкретных индексах, является одной из наиболее распространенных систем, используемых политиками и международными организациями для оценки социально-экономического контекста стран. Некоторые известные примеры включают Индекс человеческого развития (Организация Объединенных Наций), Индекс ведения бизнеса ( Всемирный банк ), Индекс восприятия коррупции (Transparency International) и Индекс экономической свободы (Фонд наследия). Например, Индекс ведения бизнеса Всемирного банка измеряет регулирование бизнеса и его соблюдение в 190 странах. Страны ранжируются по десяти показателям, которые синтезируются для получения окончательного рейтинга. Каждый показатель состоит из субиндикаторов; например, показатель регистрации собственности состоит из четырех подпоказателей, измеряющих время, процедуры, затраты и качество системы регистрации земли. Эти виды рангов основаны на субъективных критериях присвоения баллов. Иногда принятые параметры могут привести к расхождениям с эмпирическими наблюдениями, поэтому в результате применения этих критериев могут возникнуть потенциальные ошибки и парадоксы. [10]
{{cite journal}}
: Требуется цитировать журнал |journal=
( помощь )