stringtranslate.com

Рейтинг страницы

Простая иллюстрация алгоритма Pagerank. Процент показывает воспринимаемую важность, а стрелки обозначают гиперссылки.

PageRank ( PR ) — это алгоритм , используемый поиском Google для ранжирования веб-страниц в результатах поисковых систем . Он назван в честь термина «веб-страница» и соучредителя Ларри Пейджа . PageRank — это способ измерения важности страниц веб-сайта. По данным Google:

PageRank подсчитывает количество и качество ссылок на страницу, чтобы приблизительно оценить важность веб-сайта. Основное предположение заключается в том, что более важные веб-сайты, скорее всего, получат больше ссылок с других веб-сайтов. [1]

В настоящее время PageRank — не единственный алгоритм, используемый Google для упорядочивания результатов поиска, но это первый алгоритм, использованный компанией, и он наиболее известен. [2] [3] По состоянию на 24 сентября 2019 г. срок действия всех патентов, связанных с PageRank, истек. [4]

Описание

PageRank — это алгоритм анализа ссылок , который присваивает числовой вес каждому элементу набора документов, связанных гиперссылками , например, во Всемирной паутине , с целью «измерения» его относительной важности в наборе. Алгоритм может быть применен к любому набору сущностей с взаимными кавычками и ссылками. Числовой вес, который он присваивает любому данному элементу E, называется PageRank E и обозначается как

PageRank является результатом математического алгоритма, основанного на веб-графе , созданном всеми страницами Всемирной паутины в качестве узлов и гиперссылками в качестве ребер, с учетом таких авторитетных центров, как cnn.com или mayoclinic.org . Значение ранга указывает на важность конкретной страницы. Гиперссылка на страницу считается голосом в поддержку. PageRank страницы определяется рекурсивно и зависит от количества и показателя PageRank всех страниц, которые ссылаются на нее (« входящие ссылки »). Страница, на которую ссылается множество страниц с высоким PageRank, сама получает высокий рейтинг.

После выхода оригинальной статьи Пейджа и Брина было опубликовано множество научных статей, касающихся PageRank. [5] На практике концепция PageRank может быть уязвима для манипуляций. Было проведено исследование по выявлению ложно влияющих на рейтинг PageRank. Цель состоит в том, чтобы найти эффективные средства игнорирования ссылок из документов с ложным влиянием PageRank. [6]

Другие алгоритмы ранжирования веб-страниц на основе ссылок включают алгоритм HITS, изобретенный Джоном Кляйнбергом (используется Teoma и теперь Ask.com ), проект IBM CLEVER , алгоритм TrustRank , алгоритм Hummingbird [7] и алгоритм SALSA . [8]

История

Проблема собственных значений , лежащая в основе алгоритма PageRank, была независимо переоткрыта и повторно использована во многих задачах оценки. В 1895 году Эдмунд Ландау предложил использовать его для определения победителя шахматного турнира. [9] [10] Проблема собственных значений была также предложена в 1976 году Габриэлем Пински и Фрэнсисом Нарином, которые работали над наукометрическим рейтингом научных журналов, [11] в 1977 году Томасом Саати в его концепции процесса аналитической иерархии , которая взвешивала альтернативные варианты, [ 12], а в 1995 году Брэдли Лавом и Стивеном Сломаном в качестве когнитивной модели понятий — алгоритм центральности. [13] [14]

Поисковая система RankDex от IDD Information Services, разработанная Робином Ли в 1996 году, разработала стратегию оценки сайта и ранжирования страниц. [15] Ли назвал свой механизм поиска «анализом ссылок», который включает в себя ранжирование популярности веб-сайта на основе количества других сайтов, ссылающихся на него. [16] RankDex, первая поисковая система с алгоритмами ранжирования страниц и сайтов, была запущена в 1996 году. [17] Ли подал патент на эту технологию в RankDex в 1997 году; он был предоставлен в 1999 году. [18] Позже он использовал его, когда основал Baidu в Китае в 2000 году. [19] [20] Основатель Google Ларри Пейдж ссылался на работу Ли как на цитату в некоторых из своих американских патентов на PageRank. [21] [17] [22]

Ларри Пейдж и Сергей Брин разработали PageRank в Стэнфордском университете в 1996 году в рамках исследовательского проекта нового типа поисковой системы. Интервью с Эктором Гарсиа-Молиной , профессором Стэнфордской информатики и советником Сергея, [23] дает представление о разработке алгоритма ранжирования страниц. [24] У Сергея Брина возникла идея, что информацию в сети можно упорядочить в иерархии по «популярности ссылок»: страница занимает более высокий рейтинг, чем больше ссылок на нее. [25] Система была разработана с помощью Скотта Хассана и Алана Стеремберга, которые, по словам Пейджа и Брина, сыграли решающую роль в развитии Google. [5] Раджив Мотвани и Терри Виноград вместе с Пейджем и Брином написали в соавторстве с Пейджем и Брином первую статью о проекте, описывающую PageRank и первоначальный прототип поисковой системы Google , опубликованную в 1998 году. [5] Вскоре после этого Пейдж и Брин основали Google Inc. . , компания, создавшая поисковую систему Google. Хотя PageRank является лишь одним из многих факторов, определяющих рейтинг результатов поиска Google, он продолжает обеспечивать основу для всех инструментов веб-поиска Google. [26]

Название «PageRank» связано с именем разработчика Ларри Пейджа, а также с концепцией веб-страницы . [27] [28] Это слово является товарным знаком Google, а процесс PageRank запатентован ( патент США 6,285,999 ). Однако патент принадлежит Стэнфордскому университету, а не Google. Google обладает эксклюзивными лицензионными правами на патент Стэнфордского университета. Университет получил 1,8 миллиона акций Google в обмен на использование патента; в 2005 году она продала акции за 336 миллионов долларов США . [29] [30]

На PageRank повлиял анализ цитирования , ранее разработанный Юджином Гарфилдом в 1950-х годах в Университете Пенсильвании, и Hyper Search , разработанный Массимо Маркиори в Университете Падуи . В том же году, когда был введен PageRank (1998), Джон Кляйнберг опубликовал свою работу о HITS . Основатели Google цитируют Гарфилда, Маркиори и Кляйнберга в своих оригинальных статьях. [5] [31]

Алгоритм

Алгоритм PageRank выводит распределение вероятностей , используемое для представления вероятности того, что человек, случайно нажимающий на ссылки, попадет на какую-либо конкретную страницу. PageRank можно рассчитать для коллекций документов любого размера. В нескольких исследовательских работах предполагается, что распределение равномерно разделено между всеми документами в коллекции в начале вычислительного процесса. Вычисления PageRank требуют нескольких проходов, называемых «итерациями», через коллекцию для корректировки приблизительных значений PageRank, чтобы они более точно отражали теоретическое истинное значение.

Вероятность выражается в виде числового значения от 0 до 1. Вероятность 0,5 обычно выражается как «вероятность 50%» того, что что-то произойдет. Следовательно, документ с PageRank 0,5 означает, что существует 50% вероятность того, что человек, нажавший на случайную ссылку, будет перенаправлен на указанный документ.

Упрощенный алгоритм

Предположим , что это небольшая вселенная из четырех веб-страниц: A , B , C и D. Ссылки со страницы на себя игнорируются. Несколько исходящих ссылок с одной страницы на другую рассматриваются как одна ссылка. PageRank инициализируется одинаковым значением для всех страниц. В исходной форме PageRank сумма PageRank по всем страницам представляла собой общее количество страниц в сети на тот момент, поэтому каждая страница в этом примере имела бы начальное значение 1. Однако более поздние версии PageRank и В оставшейся части этого раздела предположим, что распределение вероятностей находится между 0 и 1. Следовательно, начальное значение для каждой страницы в этом примере равно 0,25.

PageRank, передаваемый от данной страницы к целям ее исходящих ссылок на следующей итерации, делится поровну между всеми исходящими ссылками.

Если бы единственные ссылки в системе были со страниц B , C и D на A , каждая ссылка передала бы 0,25 PageRank на A при следующей итерации, что в сумме составит 0,75.

Предположим, что вместо этого страница B имеет ссылку на страницы C и A , страница C имеет ссылку на страницу A , а страница D содержит ссылки на все три страницы. Таким образом, при первой итерации страница B перенесет половину существующего значения (0,125) на страницу A , а другую половину (0,125) на страницу C. Страница C перенесет все свое существующее значение (0,25) на единственную страницу, на которую она ссылается, A . Поскольку у D было три исходящих канала, он перенес бы одну треть своей существующей стоимости, или примерно 0,083, в A. По завершении этой итерации страница А будет иметь PageRank примерно 0,458.

Другими словами, PageRank, присвоенный исходящей ссылкой, равен собственному рейтингу PageRank документа, деленному на количество исходящих ссылок L( ) .

В общем случае значение PageRank для любой страницы u можно выразить как:

,

т.е. значение PageRank для страницы u зависит от значений PageRank для каждой страницы v , содержащихся в наборе B u (набор, содержащий все страницы, ссылающиеся на страницу u ), разделенных на количество L ( v ) ссылок со страницы v .

Коэффициент демпфирования

Теория PageRank утверждает, что воображаемый пользователь, случайно нажимающий на ссылки, в конечном итоге перестанет нажимать на них. Вероятность на любом этапе того, что человек продолжит переходить по ссылкам, является демпфирующим фактором d . Вероятность того, что вместо этого они перейдут на любую случайную страницу, равна 1 - d . В различных исследованиях проверялись разные коэффициенты демпфирования, но обычно предполагается, что коэффициент демпфирования будет установлен на уровне 0,85. [5]

Коэффициент демпфирования вычитается из 1 (а в некоторых вариантах алгоритма результат делится на количество документов ( N ) в коллекции), а затем этот член прибавляется к произведению коэффициента демпфирования и суммы входящие оценки PageRank. То есть,

Таким образом, PageRank любой страницы в значительной степени зависит от PageRank других страниц. Коэффициент демпфирования корректирует полученное значение в сторону уменьшения. Однако в оригинальной статье была приведена следующая формула, которая привела к некоторой путанице:

Разница между ними в том, что значения PageRank в первой формуле в сумме равны единице, а во второй формуле каждый PageRank умножается на N , и сумма становится N. Утверждение в статье Пейджа и Брина о том, что «сумма всех PageRank равна единице» [5] и заявления других сотрудников Google [32] подтверждают первый вариант приведенной выше формулы.

Пейдж и Брин перепутали две формулы в своей самой популярной статье «Анатомия крупномасштабной гипертекстовой поисковой системы в Интернете», где они ошибочно заявили, что последняя формула формирует распределение вероятностей по веб-страницам. [5]

Google пересчитывает баллы PageRank каждый раз, когда сканирует Интернет и перестраивает свой индекс. По мере того как Google увеличивает количество документов в своей коллекции, начальное приближение PageRank уменьшается для всех документов.

В формуле используется модель случайного пользователя , который попадает на целевой сайт после нескольких кликов, а затем переключается на случайную страницу. Значение PageRank страницы отражает вероятность того, что случайный пользователь попадет на эту страницу, щелкнув ссылку. Ее можно понимать как цепь Маркова , в которой состояния являются страницами, а переходы — связями между страницами, причем все они равновероятны.

Если страница не имеет ссылок на другие страницы, она становится приемником и, следовательно, прекращает процесс случайного просмотра. Если случайный пользователь попадает на страницу приемника, он случайным образом выбирает другой URL-адрес и продолжает просмотр снова.

При расчете PageRank предполагается, что страницы без исходящих ссылок ссылаются на все остальные страницы в коллекции. Таким образом, их рейтинг PageRank делится поровну между всеми остальными страницами. Другими словами, чтобы быть честным со страницами, которые не являются приемниками, эти случайные переходы добавляются ко всем узлам в сети. Эта остаточная вероятность d обычно устанавливается равной 0,85 и оценивается на основе частоты, с которой средний пользователь использует функцию закладок своего браузера. Итак, уравнение выглядит следующим образом:

где находятся рассматриваемые страницы, — набор страниц, ссылающихся на , — количество исходящих ссылок на странице , — общее количество страниц.

Значения PageRank — это элементы доминирующего правого собственного вектора модифицированной матрицы смежности, масштаб которых изменен так, что сумма каждого столбца равна единице. Это делает PageRank особенно элегантным показателем: собственный вектор

где R — решение уравнения

где функция смежности — это отношение количества исходящих ссылок со страницы j на страницу i к общему количеству исходящих ссылок страницы j. Функция смежности равна 0, если страница не ссылается на , и нормализуется так, что для каждого j

,

т.е. сумма элементов каждого столбца равна 1, поэтому матрица является стохастической матрицей (более подробную информацию см. в разделе «Вычисления» ниже). Таким образом, это вариант меры центральности собственного вектора , обычно используемой в сетевом анализе .

Из-за большого собственного зазора модифицированной матрицы смежности, приведенной выше, [33] значения собственного вектора PageRank могут быть аппроксимированы с высокой степенью точности всего за несколько итераций.

Основатели Google в своей оригинальной статье [31] сообщили, что алгоритм PageRank для сети, состоящей из 322 миллионов ссылок (входящих и исходящих), сходится в пределах допустимого предела за 52 итерации. Сходимость в сети вдвое меньшего размера заняла примерно 45 итераций. На основе этих данных они пришли к выводу, что алгоритм можно очень хорошо масштабировать и что коэффициент масштабирования для чрезвычайно больших сетей будет примерно линейным по , где n — размер сети.

В результате теории Маркова можно показать, что PageRank страницы — это вероятность перехода на эту страницу после большого количества кликов. Это оказывается равным ожиданию количества кликов (или случайных переходов) , необходимых для перехода со страницы обратно на себя.

Одним из основных недостатков PageRank является то, что он отдает предпочтение старым страницам. На новой странице, даже очень хорошей, не будет много ссылок, если она не является частью существующего сайта (сайт представляет собой плотно связанный набор страниц, например, Википедия ).

Было предложено несколько стратегий для ускорения расчета PageRank. [34]

Различные стратегии манипулирования PageRank использовались в согласованных усилиях по улучшению рейтинга в результатах поиска и монетизации рекламных ссылок. Эти стратегии серьезно повлияли на надежность концепции PageRank, которая призвана определить , какие документы на самом деле высоко ценятся веб-сообществом.

С декабря 2007 года, когда Google начал активно наказывать сайты, продающие платные текстовые ссылки, Google боролся с ссылочными фермами и другими схемами, предназначенными для искусственного завышения PageRank. То, как Google определяет фермы ссылок и другие инструменты манипулирования PageRank, является коммерческой тайной Google .

Вычисление

PageRank можно вычислять итеративно или алгебраически. Итерационный метод можно рассматривать как степенной итерационный метод [35] [36] или степенной метод. Основные выполняемые математические операции идентичны.

Итеративный

При предполагается начальное распределение вероятностей, обычно

.

где N — общее количество страниц, а — страница i в момент времени 0.

На каждом временном шаге вычисление, как подробно описано выше, дает

где d — коэффициент демпфирования,

или в матричной записи

где и — вектор-столбец длины, содержащий только единицы.

Матрица определяется как

то есть,

,

где обозначает матрицу смежности графа, а — диагональная матрица с исходящими степенями на диагонали.

Расчет вероятности производится для каждой страницы в определенный момент времени, а затем повторяется для следующего момента времени. Вычисление заканчивается, когда для некоторого малого

,

т. е. когда предполагается сходимость.

Силовой метод

Если матрица является вероятностью перехода, т. е. стохастической по столбцу, и представляет собой распределение вероятностей (т. е. , где - матрица всех единиц), то уравнение ( 2 ) эквивалентно

Следовательно, PageRank является главным собственным вектором . Быстрый и простой способ вычислить это — использовать степенной метод : начиная с произвольного вектора , оператор применяется последовательно, т. е.

,

до

.

Обратите внимание, что в уравнении ( 3 ) матрицу в правой части скобок можно интерпретировать как

,

где – начальное распределение вероятностей. в текущем случае

.

Наконец, если столбцы имеют только нулевые значения, их следует заменить исходным вектором вероятности . Другими словами,

,

где матрица определяется как

,

с

В этом случае два приведенных выше вычисления дают одинаковый PageRank только в том случае, если их результаты нормализованы:

.

Выполнение

Питон

импортировать  numpy  как  npdef  pagerank ( M ,  d :  float  =  0.85 ): """Алгоритм PageRank с явным количеством итераций. Возвращает рейтинг узлов (страниц) в матрице смежности.  Параметры  ----------  M : матрица смежности массива numpy  , где M_i,j представляет ссылку от 'j' до 'i', так что для всех 'j'  sum(i, M_i,j) = 1  d: плавающее значение, дополнительный  коэффициент демпфирования, по умолчанию 0,85. Возвращает  -------  массив numpy -  вектор рангов такой, что v_i — i-й ранг из [0, 1], "  " " N  =  M. shape [ 1 ] w = np.ones ( N ) / N M_hat = d * M v = M_hat @ w + ( 1 - d ) while ( np . linalg .norm ( w - v ) >= 1e-10 ): w = v v = M_hat @ w + ( 1 - d ) return v                                      М  =  нп . массив ([[ 0 ,  0 ,  0 ,  0 ],  [ 0 ,  0 ,  0 , 0 ] , [ 1 , 0,5 , 0 , 0 ], [ 0 , 0,5 , 1 , 0 ] ]) v = рейтинг страницы ( M , 0,85 )            

Вариации

PageRank неориентированного графа

PageRank неориентированного графа статистически близок к распределению степеней графа [37] , но они, как правило, не идентичны: If – вектор PageRank, определенный выше, и – вектор распределения степеней

где обозначает степень вершины и является набором ребер графа, тогда при , [38] показывает, что:

то есть PageRank неориентированного графа равен вектору распределения степеней тогда и только тогда, когда граф регулярен, т. е. каждая вершина имеет одинаковую степень.

Ранжирование объектов двух видов

Обобщение PageRank на случай ранжирования двух взаимодействующих групп объектов было описано Даугулисом. [39] В приложениях может возникнуть необходимость моделировать системы, имеющие объекты двух типов, где взвешенное отношение определяется для пар объектов. Это приводит к рассмотрению двудольных графов . Для таких графов можно определить две связанные положительные или неотрицательные неприводимые матрицы, соответствующие множествам разбиений вершин. Ранги объектов в обеих группах можно вычислить как собственные векторы, соответствующие максимальным положительным собственным значениям этих матриц. Нормированные собственные векторы существуют и уникальны по теореме Перрона или Перрона – Фробениуса. Пример: потребители и продукты. Вес отношения – это норма потребления продукта.

Распределенный алгоритм расчета PageRank

Сарма и др. описать два распределенных алгоритма на основе случайного блуждания для вычисления PageRank узлов в сети. [40] Один алгоритм с высокой вероятностью выполняет раунды на любом графе (направленном или ненаправленном), где n — размер сети, а — вероятность сброса ( , которая называется коэффициентом затухания), используемая при вычислении PageRank. Они также представляют более быстрый алгоритм, который выполняет обходы в неориентированных графах. В обоих алгоритмах каждый узел обрабатывает и отправляет за раунд определенное количество битов, полилогарифмическое от n — размера сети.

Панель инструментов Google

На панели инструментов Google уже давно имеется функция PageRank, которая отображает PageRank посещенной страницы в виде целого числа от 0 (наименее популярный) до 10 (наиболее популярный). Google не раскрыл конкретный метод определения значения PageRank панели инструментов, которое следует рассматривать лишь как приблизительный показатель ценности веб-сайта. «Рейтинг панели инструментов» был доступен проверенным администраторам сайта через интерфейс Инструментов Google для веб-мастеров. Однако 15 октября 2009 года сотрудник Google подтвердил, что компания удалила PageRank из раздела «Инструменты для веб-мастеров» , заявив: «Мы уже давно говорим людям, что им не следует так сильно зацикливаться на PageRank. Многие сайты владельцы, кажется, думают, что это самый важный показатель , который им нужно отслеживать, но это неправда». [41]

«Рейтинг панели инструментов» обновлялся очень редко. Последний раз он обновлялся в ноябре 2013 года. В октябре 2014 года Мэтт Каттс объявил, что еще одного заметного обновления рейтинга страниц не будет. [42] В марте 2016 года Google объявил, что больше не будет поддерживать эту функцию, и базовый API вскоре перестанет работать. [43] 15 апреля 2016 года Google отключил отображение данных PageRank на панели инструментов Google, [44] хотя PageRank продолжал использоваться внутри компании для ранжирования контента в результатах поиска. [45]

Рейтинг в поисковой выдаче

Страница результатов поисковой системы ( SERP) — это фактический результат, возвращаемый поисковой системой в ответ на запрос по ключевому слову. SERP состоит из списка ссылок на веб-страницы с соответствующими текстовыми фрагментами, платными объявлениями, избранными фрагментами и вопросами и ответами. Рейтинг веб-страницы в поисковой выдаче относится к размещению соответствующей ссылки в поисковой выдаче, где более высокое размещение означает более высокий рейтинг в поисковой выдаче. Рейтинг веб-страницы в поисковой выдаче зависит не только от ее PageRank, но и от относительно большого и постоянно корректируемого набора факторов (более 200). [46] [ ненадежный источник? ] Поисковая оптимизация (SEO) направлена ​​на повышение рейтинга веб-сайта или набора веб-страниц в поисковой выдаче.

Позиционирование веб-страницы в поисковой выдаче Google по ключевому слову зависит от релевантности и репутации, также известных как авторитет и популярность. PageRank — это показатель Google оценки репутации веб-страницы: он не зависит от ключевого слова. Google использует комбинацию авторитетности веб-страницы и веб-сайта, чтобы определить общий авторитет веб-страницы, конкурирующей за ключевое слово. [47] PageRank домашней страницы веб-сайта является лучшим индикатором авторитетности веб-сайта, предлагаемым Google. [48]

После внедрения Google Адресов в основную органическую поисковую выдачу на рейтинг компании в результатах местного бизнеса влияет множество других факторов, помимо PageRank. [49] Когда Google подробно рассказал о причинах снижения рейтинга PageRank на конференции «Вопросы и ответы» #март 2016 г., они объявили ссылки и контент главными факторами ранжирования. Ранее, в октябре 2015 года, RankBrain был объявлен фактором ранжирования №3, поэтому Google официально подтвердил три главных фактора. [50]

PageRank в каталоге Google

PageRank каталога Google измерялся 8 единицами. В отличие от панели инструментов Google, которая показывает числовое значение PageRank при наведении курсора мыши на зеленую полосу, в Каталоге Google отображается только полоса, а не числовые значения. Каталог Google был закрыт 20 июля 2011 г. [51]

Ложный или поддельный PageRank

Было известно, что PageRank, отображаемый на панели инструментов, можно было легко подделать . Перенаправление с одной страницы на другую либо через ответ HTTP 302 , либо через метатег «Обновить» приводило к тому, что исходная страница получала PageRank целевой страницы. Следовательно, новая страница с PR 0 и отсутствием входящих ссылок могла бы получить PR 10 при перенаправлении на домашнюю страницу Google. Подделку обычно можно обнаружить, выполнив поиск в Google исходного URL-адреса; если в результатах отображается URL-адрес совершенно другого сайта, последний URL-адрес может представлять собой пункт назначения перенаправления.

Манипулирование PageRank

В целях поисковой оптимизации некоторые компании предлагают продавать ссылки с высоким PageRank веб-мастерам. [52] Поскольку ссылки со страниц с более высоким PR считаются более ценными, они, как правило, стоят дороже. Покупка рекламных ссылок на качественных страницах контента и соответствующих сайтах может быть эффективной и жизнеспособной маркетинговой стратегией для привлечения трафика и повышения популярности ссылок веб-мастера. Однако Google публично предупредил веб-мастеров, что если они продают ссылки с целью повышения PageRank и репутации, их ссылки будут обесценены (игнорируются при расчете PageRank других страниц). Практика покупки и продажи [53] активно обсуждается в сообществе веб-мастеров. Google посоветовал веб-мастерам использовать значение HTML-атрибута nofollow в платных ссылках. По словам Мэтта Каттса , Google обеспокоен веб-мастерами, которые пытаются обмануть систему и тем самым снизить качество и релевантность результатов поиска Google. [52]

В 2019 году Google предложил новый тип тегов, которые не передают PageRank и, следовательно, не имеют значения для манипулирования ссылками SEO: rel="ugc" в качестве тега для пользовательского контента, такого как комментарии; и тег rel="sponsored" для рекламы или других типов спонсируемого контента. [54]

Несмотря на то, что PageRank стал менее важным для целей SEO, наличие обратных ссылок с более популярных веб-сайтов продолжает поднимать веб-страницу выше в поисковых рейтингах. [55]

Модель направленного серфера

Более умный пользователь, который вероятностно перескакивает со страницы на страницу в зависимости от содержания страниц и условий запроса, которые ищет пользователь. Эта модель основана на зависящем от запроса рейтинге PageRank страницы, который, как следует из названия, также является функцией запроса. При получении запроса с несколькими терминами пользователь выбирает a в соответствии с некоторым распределением вероятностей и использует этот термин для управления своим поведением на большом количестве шагов. Затем он выбирает другой термин в соответствии с распределением, чтобы определить свое поведение, и так далее. Результирующее распределение по посещенным веб-страницам представляет собой QD-PageRank. [56]

Социальные компоненты

Катя Майер рассматривает PageRank как социальную сеть, объединяющую различные точки зрения и мысли в одном месте. [57] Люди заходят на PageRank за информацией и завалены цитатами других авторов, у которых также есть мнение по этой теме. Это создает социальный аспект, где все можно обсудить и собрать, чтобы спровоцировать размышления. Между PageRank и людьми, которые его используют, существует социальная связь, поскольку он постоянно адаптируется и меняется к изменениям в современном обществе. Просмотр взаимосвязи между PageRank и личностью с помощью социометрии позволяет более глубоко изучить возникающую связь.

Маттео Паскинелли [58] считает, что в основе убеждения в том, что PageRank имеет социальный компонент, лежит идея экономики внимания . При экономии внимания ценность придается продуктам, которые привлекают больше человеческого внимания, а результаты, находящиеся в верхней части PageRank, привлекают большее внимание, чем результаты на последующих страницах. Таким образом, результаты с более высоким PageRank будут в большей степени проникать в человеческое сознание. Эти идеи могут влиять на принятие решений, а действия зрителя имеют прямое отношение к PageRank. Они обладают более высоким потенциалом привлечения внимания пользователя, поскольку их расположение увеличивает экономию внимания, прилагаемую к сайту. Благодаря этому местоположению они смогут получать больше трафика, а на их онлайн-рынке будет больше покупок. PageRank этих сайтов позволяет им доверять, и они могут использовать это доверие для увеличения бизнеса.

Другое использование

Математика PageRank полностью общая и применима к любому графу или сети в любой области. Таким образом, PageRank теперь регулярно используется в библиометрии, анализе социальных и информационных сетей, а также для прогнозирования и рекомендации ссылок. Он используется для системного анализа дорожных сетей, а также в биологии, химии, нейробиологии и физике. [59]

Научные исследования и академические круги

PageRank использовался для количественной оценки научного вклада исследователей. Базовые сети цитирования и сотрудничества используются в сочетании с алгоритмом рейтинга страниц, чтобы создать систему ранжирования отдельных публикаций, которая распространяется на отдельных авторов. Новый индекс, известный как индекс PageRank (Pi), оказался более справедливым по сравнению с индексом Хирша в контексте многих недостатков, присущих индексу Хирша. [60]

PageRank также является полезным инструментом для анализа белковых сетей в биологии. [61] [62]

В любой экосистеме модифицированная версия PageRank может использоваться для определения видов, которые необходимы для постоянного поддержания здоровья окружающей среды. [63]

Аналогичное новое использование PageRank заключается в ранжировании академических докторских программ на основе данных о размещении их выпускников на преподавательских должностях. С точки зрения PageRank академические факультеты связываются друг с другом, нанимая преподавателей друг у друга (и у самих себя). [64]

Версия PageRank недавно была предложена в качестве замены традиционного импакт-фактора Института научной информации (ISI) [65] и реализована в Eigenfactor , а также в SCImago . Вместо простого подсчета общего количества цитирований в журнале «важность» каждой цитаты определяется с помощью PageRank.

В нейробиологии было обнаружено , что PageRank нейрона в нейронной сети коррелирует с его относительной скоростью срабатывания. [66]

Использование Интернета

Персонализированный PageRank используется Twitter для предоставления пользователям других учетных записей, на которые они, возможно, захотят подписаться. [67]

Продукт поиска по сайту Swiftype создает «PageRank, специфичный для отдельных веб-сайтов», анализируя сигналы важности каждого веб-сайта и расставляя приоритеты контента на основе таких факторов, как количество ссылок с главной страницы. [68]

Поисковый робот может использовать PageRank как один из ряда важных показателей, которые он использует для определения того, какой URL-адрес посетить во время сканирования Интернета. Одним из первых рабочих документов [69] , которые использовались при создании Google, является «Эффективное сканирование посредством упорядочения URL-адресов» , [70] в котором обсуждается использование ряда различных показателей важности для определения того, насколько глубоко и какую часть сайта Google поползет. PageRank представлен как один из многих таких показателей важности, хотя есть и другие, такие как количество входящих и исходящих ссылок для URL-адреса и расстояние от корневого каталога сайта до URL-адреса.

PageRank также может использоваться в качестве методологии для измерения очевидного влияния такого сообщества, как блогосфера, на саму сеть в целом. Таким образом, этот подход использует PageRank для измерения распределения внимания, что отражает парадигму безмасштабной сети . [ нужна цитата ]

Другие приложения

В 2005 году в пилотном исследовании «Структурная глубокая демократия», проведенном в Пакистане, SD2 [71] [72] использовался для отбора лидеров в группе устойчивого сельского хозяйства под названием «Контактная молодежь». SD2 использует PageRank для обработки транзитивных голосов по доверенности с дополнительными ограничениями, требующими наличия как минимум двух первоначальных доверенных лиц на каждого избирателя, и все избиратели являются доверенными кандидатами. На основе SD2 могут быть построены более сложные варианты, такие как добавление специализированных доверенных лиц и прямое голосование по конкретным вопросам, но SD2, как базовая зонтичная система, требует всегда использовать универсальные доверенные лица.

В спорте алгоритм PageRank использовался для ранжирования результатов: команд Национальной футбольной лиги (НФЛ) в США; [73] отдельные футболисты; [74] и спортсмены Бриллиантовой лиги. [75]

PageRank использовался для ранжирования пространств или улиц, чтобы предсказать, сколько людей (пешеходов или транспортных средств) приходит в отдельные места или улицы. [76] [77] В лексической семантике он использовался для устранения неоднозначности смысла слова , [78] Семантического сходства , [79] , а также для автоматического ранжирования синсетов WordNet в соответствии с тем, насколько сильно они обладают данным семантическим свойством, таким как позитивность или негатив. [80]

Изменение режима работы транспортной системы можно описать переходами между квазистационарными состояниями в корреляционных структурах транспортных потоков. PageRank использовался для выявления и изучения доминирующих состояний среди этих квазистационарных состояний в дорожных системах. [81]

не следует

В начале 2005 года Google ввел новое значение « nofollow » [82] для атрибута rel HTML-ссылок и элементов привязки, чтобы разработчики веб-сайтов и блоггеры могли создавать ссылки, которые Google не будет учитывать для целей PageRank — они ссылки, которые больше не представляют собой «голосование» в системе PageRank. Отношение nofollow было добавлено в попытке помочь в борьбе со спамдексом .

Например, раньше люди могли создавать множество сообщений на досках объявлений со ссылками на свой веб-сайт, чтобы искусственно повысить свой PageRank. Используя значение nofollow, администраторы досок объявлений могут изменить свой код, чтобы автоматически вставлять «rel='nofollow'» во все гиперссылки в сообщениях, тем самым предотвращая влияние этих конкретных сообщений на PageRank. Однако этот метод уклонения также имеет различные недостатки, такие как снижение ценности ссылок на законные комментарии. (См.: Спам в блогах#nofollow )

Стремясь вручную контролировать поток PageRank между страницами веб-сайта, многие веб-мастера практикуют так называемое моделирование PageRank [83] — это стратегический процесс размещения атрибута nofollow на определенных внутренних ссылках веб-сайта с целью PageRank относительно тех страниц, которые веб-мастер считает наиболее важными. Эта тактика использовалась с момента появления атрибута nofollow, но, возможно, больше не будет эффективной, поскольку Google объявил, что блокировка передачи PageRank с помощью nofollow не перенаправляет этот PageRank на другие ссылки. [84]

Смотрите также

Рекомендации

Цитаты

  1. ^ «Факты о Google и конкуренции». Архивировано из оригинала 4 ноября 2011 года . Проверено 12 июля 2014 г.
  2. ^ Салливан, Дэнни (26 апреля 2007 г.). «Что такое Google PageRank? Руководство для поисковиков и веб-мастеров». Земля поисковых систем . Архивировано из оригинала 3 июля 2016 г.
  3. ^ Каттс, Мэтт. «Алгоритмы ранжируют релевантные результаты выше». Архивировано из оригинала 2 июля 2013 года . Проверено 19 октября 2015 г.
  4. ^ «US7058628B1 — Метод ранжирования узлов в связанной базе данных — Патенты Google» . Гугл Патенты . Архивировано из оригинала 16 января 2020 года . Проверено 14 сентября 2019 г.
  5. ^ abcdefg Брин, С .; Пейдж, Л. (1998). «Анатомия крупномасштабной гипертекстовой поисковой системы в Интернете» (PDF) . Компьютерные сети и системы ISDN . 30 (1–7): 107–117. CiteSeerX 10.1.1.115.5930 . дои : 10.1016/S0169-7552(98)00110-X. ISSN  0169-7552. S2CID  7587743. Архивировано (PDF) из оригинала 27 сентября 2015 г. 
  6. ^ Дьёндьи, Золтан; Берхин Павел; Гарсиа-Молина, Гектор; Педерсен, январь (2006 г.), «Обнаружение ссылочного спама на основе массовой оценки», Труды 32-й Международной конференции по очень большим базам данных (VLDB '06, Сеул, Корея) (PDF) , стр. 439–450, в архиве (PDF) ) из оригинала от 3 декабря 2014 г..
  7. ^ «Часто задаваемые вопросы: все о новом алгоритме Google «Колибри»» . Земля поисковых систем . 26 сентября 2013 г. Архивировано из оригинала 23 декабря 2018 г. Проверено 18 декабря 2018 г.
  8. ^ Ван, Цзыян. «Улучшенные алгоритмы ранжирования веб-страниц на основе ссылок» (PDF) . cs.nyu.edu . Нью-Йоркский университет, факультет компьютерных наук . Проверено 7 августа 2023 г.
  9. ^ Ландау, Эдмунд (1895). «Относительный Wertbemessung der Turnierresultate». Немецкий Вохеншах . 11 (42): 51–54.
  10. ^ Синн, Райнер; Циглер, Гюнтер М. (31 октября 2022 г.). «Ландау о шахматных турнирах и PageRank Google». arXiv : 2210.17300 [math.HO].
  11. ^ Габриэль Пински и Фрэнсис Нарин (1976). «Влияние цитируемости на журнальные совокупности научных публикаций: Теория с применением к физической литературе». Обработка информации и управление . 12 (5): 297–312. дои : 10.1016/0306-4573(76)90048-0.
  12. ^ Томас Саати (1977). «Метод масштабирования приоритетов в иерархических структурах». Журнал математической психологии . 15 (3): 234–281. дои : 10.1016/0022-2496(77)90033-5. hdl : 10338.dmlcz/101787 .
  13. ^ Брэдли К. Лав и Стивен А. Сломан. «Изменчивость и детерминанты концептуальной трансформируемости» (PDF) . Труды семнадцатой ежегодной конференции Общества когнитивных наук . стр. 654–659. Архивировано (PDF) из оригинала 23 декабря 2017 г. Проверено 23 декабря 2017 г.
  14. ^ «Как студент CogSci изобрел PageRank за три года до Google» . сайт bradlove.org. Архивировано из оригинала 11 декабря 2017 г. Проверено 23 декабря 2017 г.
  15. Ли, Яньхун (6 августа 2002 г.). «На пути к качественной поисковой системе». IEEE Интернет-вычисления . 2 (4): 24–29. дои : 10.1109/4236.707687.
  16. ^ «Расцвет Baidu (это китайский язык для Google)» . Нью-Йорк Таймс . 17 сентября 2006 г. Архивировано из оригинала 27 июня 2019 г. Проверено 16 июня 2019 г.
  17. ^ ab «О: RankDex». Архивировано 25 мая 2015 г. в Wayback Machine , RankDex ; по состоянию на 3 мая 2014 г.
  18. ^ USPTO, «Система и метод поиска гипертекстовых документов». Архивировано 5 декабря 2011 г. в Wayback Machine , Номер патента США: 5920859, Изобретатель: Яньхун Ли, Дата подачи: 5 февраля 1997 г., Дата выдачи: 6 июля 1999 г.
  19. Гринберг, Энди, «Человек, который побеждает Google». Архивировано 8 марта 2013 г. в Wayback Machine , журнал Forbes , 5 октября 2009 г.
  20. ^ «О: RankDex». Архивировано 20 января 2012 г. на Wayback Machine , Rankdex.com.
  21. ^ «Метод ранжирования узлов в связанной базе данных» . Патенты Google. Архивировано из оригинала 15 октября 2015 года . Проверено 19 октября 2015 г.
  22. Альтушер, Джеймс (18 марта 2011 г.). «10 необычных вещей о Google». Форбс . Архивировано из оригинала 16 июня 2019 года . Проверено 16 июня 2019 г.
  23. ^ Грег Винтьес. «Гектор Гарсиа-Молина: Стэнфордский профессор информатики и советник Сергея». стр. минут 25.45-32.50, 34.00–38.20 . Проверено 6 декабря 2019 г.
  24. ^ Пейдж, Ларри, «PageRank: наведение порядка в Интернете» (PDF) . Архивировано (PDF) из оригинала 26 января 2009 г. Проверено 06 октября 2022 г., Стэнфордский проект цифровой библиотеки, разговор. 18 августа 1997 г. (архив 2002 г.)
  25. ^ 187-страничное исследование Университета Граца, Австрия. Архивировано 16 января 2014 г. в Wayback Machine . В нем содержится примечание о том, что при определении рейтинга страниц в Google также используется человеческий мозг.
  26. ^ «Наши продукты и услуги» . Архивировано из оригинала 23 июня 2008 г. Проверено 27 мая 2011 г.
  27. ^ Дэвид Вайс и Марк Мэлсид (2005). История Google . Делакорт Пресс. п. 37. ИСБН 978-0-553-80457-7.
  28. ^ «Пресс-центр Google: интересные факты» . Архивировано из оригинала 15 июля 2001 г.
  29. ^ Лиза М. Кригер (1 декабря 2005 г.). «Стэнфорд заработал 336 миллионов долларов на акциях Google» . Сан-Хосе Меркьюри Ньюс . Архивировано из оригинала 8 апреля 2009 года . Проверено 25 февраля 2009 г. , цитируется по redOrbit.
  30. ^ Ричард Брандт. «Начинаем. Как Google добился успеха». Стэнфордский журнал. Архивировано из оригинала 10 марта 2009 г. Проверено 25 февраля 2009 г.
  31. ^ аб Пейдж, Лоуренс ; Брин, Сергей ; Мотвани, Раджив ; Виноград, Терри (1999). Рейтинг цитируемости PageRank: Наведение порядка в Интернете (Отчет). Архивировано из оригинала 27 апреля 2006 г., опубликовано в виде технического отчета 29 января 1998 г. PDF-файл. Архивировано 18 августа 2011 г. на Wayback Machine.
  32. ^ Блог Мэтта Каттса : Прямо из Google: что вам нужно знать. Архивировано 7 февраля 2010 г. в Wayback Machine , см. стр. 15 его слайдов.
  33. ^ Тахер Хавеливала и Сепандар Камвар (март 2003 г.). «Второе собственное значение матрицы Google» (PDF) . Технический отчет Стэнфордского университета : 7056. arXiv : math/0307056 . Бибкод : 2003math......7056N. Архивировано (PDF) из оригинала 17 декабря 2008 г.
  34. ^ Джанна М. Дель Корсо; Антонио Гулли; Франческо Романи (2004). «Быстрое вычисление PageRank с помощью разреженной линейной системы (расширенное резюме)». В Стефано Леонарди (ред.). Алгоритмы и модели веб-графа: Третий международный семинар, WAW 2004, Рим, Италия, 16 октября 2004 г. Труды . стр. 118–130. CiteSeerX 10.1.1.58.9060 . дои : 10.1007/978-3-540-30216-2_10. ISBN  978-3-540-23427-2.
  35. ^ Арасу, А.; Новак Дж.; Томкинс, А.; Томлин, Дж. (2002). «Вычисление PageRank и структура сети: эксперименты и алгоритмы». Материалы одиннадцатой Международной конференции по всемирной паутине, постерный трек . Брисбен, Австралия. стр. 107–117. CiteSeerX 10.1.1.18.5264 . 
  36. ^ Массимо Франческо (2010). «PageRank: стоим на плечах гигантов». arXiv : 1002.2858 [cs.IR].
  37. ^ Никола Перра и Санто Фортунато; Фортунато (сентябрь 2008 г.). «Меры спектральной центральности в сложных сетях». Физ. Преподобный Е. 78 (3): 36107. arXiv : 0805.3322 . Бибкод : 2008PhRvE..78c6107P. doi : 10.1103/PhysRevE.78.036107. PMID  18851105. S2CID  1755112.
  38. ^ Винс Гролмуш (2015). «Примечание о PageRank неориентированных графов». Письма об обработке информации . 115 (6–8): 633–634. arXiv : 1205.1960 . дои : 10.1016/j.ipl.2015.02.015. S2CID  9855132.
  39. ^ Петерис Даугулис; Даугулис (2012). «Заметка об обобщении централизации собственных векторов для двудольных графов и приложений». Сети . 59 (2): 261–264. arXiv : 1610.01544 . дои : 10.1002/net.20442. S2CID  1436859.
  40. ^ Атиш Дас Сарма; Анисур Рахаман Молла; Гопал Пандуранган; Эли Упфал (2015). «Быстрый распределенный расчет PageRank». Теоретическая информатика . 561 : 113–121. arXiv : 1208.3071 . дои : 10.1016/j.tcs.2014.04.003. S2CID  10284718.
  41. ^ Сьюзен Москва. «Распределение PageRank удалено из WMT» . Архивировано из оригинала 17 октября 2009 года . Проверено 16 октября 2009 г.
  42. ^ Бартлеман, Уил (12 октября 2014 г.). «Обновление рейтинга страницы Google не произойдет» . Управляемый администратор. Архивировано из оригинала 02 апреля 2015 г. Проверено 12 октября 2014 г.
  43. Шварц, Барри (8 марта 2016 г.). «Google подтвердил, что удаляет PageRank панели инструментов». Земля поисковых систем . Архивировано из оригинала 10 марта 2016 года.
  44. Шварц, Барри (18 апреля 2016 г.). «Рейк страницы панели инструментов Google официально снижается» . Земля поисковых систем . Архивировано из оригинала 21 апреля 2016 г.
  45. ^ Саузерн, Мэтт (19 апреля 2016 г.). «Google PageRank официально закрывает свои двери для публики» . Журнал поисковых систем . Архивировано из оригинала 13 апреля 2017 г.
  46. ^ Фишкин, Рэнд; Джефф Поллард (2 апреля 2007 г.). «Факторы ранжирования в поисковых системах - версия 2». seomoz.org. Архивировано из оригинала 7 мая 2009 года . Проверено 11 мая 2009 г.
  47. ^ Довер, Д. Секреты поисковой оптимизации Индианаполиса. Уайли. 2011.
  48. ^ Виникер, Д. Важность проверки сложности ключевых слов для SEO . Эд. Шварц, М. Цифровой путеводитель, том 5. News Press. стр. 160–164.
  49. ^ «Рейтинг объявлений: Рейтинг - Справка Google Адресов» . Архивировано из оригинала 26 мая 2012 г. Проверено 27 мая 2011 г.
  50. ^ Кларк, Джек. «Google передает свой прибыльный веб-поиск машинам с искусственным интеллектом». Блумберг. Архивировано из оригинала 25 марта 2016 года . Проверено 26 марта 2016 г.
  51. ^ Обзор поисковой системы: каталог Google закрыт 25 июля 2011 г.
  52. ^ ab «Как сообщить о платных ссылках». mattcutts.com/блог. 14 апреля 2007 года. Архивировано из оригинала 28 мая 2007 года . Проверено 28 мая 2007 г.
  53. ^ «Схемы ссылок Google». Архивировано 21 мая 2020 г. по ссылкам Wayback Machine.
  54. ^ «Развитие». Разработчики Google . Проверено 08 февраля 2022 г.
  55. ^ «Итак... вы думаете, что SEO изменилось» . 19 марта 2014 г. Архивировано из оригинала 31 марта 2014 г.
  56. ^ Мэтью Ричардсон и Педро Домингос, А. (2001). Интеллектуальный серфер: вероятностное сочетание информации о ссылках и контенте в PageRank (PDF) . стр. 1441–1448. Архивировано (PDF) из оригинала 4 марта 2016 г.
  57. ^ Майер, Катя (2009). Глубокий поиск: политика поиска за пределами Google, социометрия поисковых систем . Студент Верлаг.
  58. ^ Паскинелли, Маттео (2009). Глубокий поиск: политика поиска за пределами Google, диаграмма когнитивного капитализма и рантье общего интеллекта . Студент Верлаг.
  59. ^ Гляйх, Дэвид Ф. (январь 2015 г.). «Ранг страницы за пределами Интернета». Обзор СИАМ . 57 (3): 321–363. arXiv : 1407.5107 . дои : 10.1137/140976649. S2CID  8375649.
  60. ^ Сенанаяке, Упул; Пиравинан, Махендра; Зомайя, Альберт (2015). «Индекс Pagerank: выходя за рамки подсчета цитирования при количественной оценке научного воздействия исследователей». ПЛОС ОДИН . 10 (8): e0134794. Бибкод : 2015PLoSO..1034794S. дои : 10.1371/journal.pone.0134794 . ISSN  1932-6203. ПМЦ 4545754 . ПМИД  26288312. 
  61. ^ Г. Иван и В. Гролмуш (2011). «Когда Интернет встречается с клеткой: использование персонализированного PageRank для анализа сетей взаимодействия белков». Биоинформатика . 27 (3): 405–7. doi : 10.1093/биоинформатика/btq680 . ПМИД  21149343.
  62. ^ Д. Банки, Г. Иван и В. Гролмуш (2013). «Равные возможности для сетевых узлов низкой степени: метод PageRank для идентификации белковых целей в метаболических графах». ПЛОС ОДИН . 8 (1): 405–7. Бибкод : 2013PLoSO...854204B. дои : 10.1371/journal.pone.0054204 . ПМЦ 3558500 . ПМИД  23382878. 
  63. ^ Бернс, Джудит (4 сентября 2009 г.). «Трюк Google отслеживает вымирания». Новости BBC . Архивировано из оригинала 12 мая 2011 г. Проверено 27 мая 2011 г.
  64. ^ Бенджамин М. Шмидт и Мэтью М. Чингос (2007). «Рейтинг докторских программ по месту размещения: новый метод» (PDF) . PS: Политология и политика . 40 (июль): 523–529. CiteSeerX 10.1.1.582.9402 . дои : 10.1017/s1049096507070771. S2CID  6012229. Архивировано (PDF) из оригинала 13 февраля 2015 г. 
  65. ^ Йохан Боллен; Марко А. Родригес; Герберт Ван де Сомпель (декабрь 2006 г.). «MESUR: Показатели научного воздействия, основанные на использовании». Материалы 7-й совместной конференции ACM/IEEE-CS по электронным библиотекам . Нью-Йорк: Ассоциация вычислительной техники. arXiv : cs.GL/0601030 . Бибкод : 2006cs........1030B. дои : 10.1145/1255175.1255273. ISBN 978-1-59593-644-8. S2CID  3115544.
  66. ^ Флетчер, Джек Маккей; Веннекерс, Томас (2017). «От структуры к активности: использование показателей центральности для прогнозирования активности нейронов». Международный журнал нейронных систем . 28 (2): 1750013. doi : 10.1142/S0129065717500137 . hdl : 10026.1/9713 . ПМИД  28076982.
  67. ^ Гупта, Панкадж; Гоэль, Ашиш; Лин, Джимми; Шарма, Аниш; Ван, Донг; Заде, Реза (2013). «WTF: Служба «За кем следить» в Твиттере». Материалы 22-й Международной конференции по Всемирной паутине . АКМ. стр. 505–514. дои : 10.1145/2488388.2488433. ISBN 978-1-4503-2035-1. S2CID  207205045 . Проверено 11 декабря 2018 г.
  68. ^ Ха, Энтони (08 мая 2012 г.). «Swiftype на базе Y Combinator создает отличный поиск по сайту» . ТехКранч . Архивировано из оригинала 6 июля 2014 г. Проверено 8 июля 2014 г.
  69. ^ «Рабочие документы, касающиеся создания Google». Google . Архивировано из оригинала 28 ноября 2006 года . Проверено 29 ноября 2006 г.
  70. ^ Чо, Дж.; Гарсиа-Молина, Х.; Пейдж, Л. (1998). «Эффективное сканирование посредством упорядочения URL». Материалы седьмой конференции по Всемирной паутине . Архивировано из оригинала 3 июня 2008 г.
  71. ^ "Yahoo! Группы" . Группы.yahoo.com. Архивировано из оригинала 4 октября 2013 г. Проверено 2 октября 2013 г.
  72. ^ «Аутопоэтические информационные системы в современных организациях». CiteSeerX 10.1.1.148.9274 . 
  73. ^ Зак, Лори; Лэмб, Рон; Болл, Сара (31 декабря 2012 г.). «Применение PageRank Google к рейтингам НФЛ». Включите: Математический журнал . 5 (4): 463–471. дои : 10.2140/involve.2012.5.463 . ISSN  1944-4184.
  74. ^ Пенья, Хавьер Лопес; Тушетт, Хьюго (28 июня 2012 г.). «Анализ сетевой теории футбольных стратегий». arXiv : 1206.6904 [math.CO].
  75. ^ Беггс, Клайв Б.; Шеперд, Саймон Дж.; Эммондс, Стейси; Джонс, Бен (2 июня 2017 г.). Чжоу, Вэй-Син (ред.). «Новое применение алгоритмов PageRank и предпочтений пользователей для оценки относительных результатов легкоатлетов на соревнованиях». ПЛОС ОДИН . 12 (6): e0178458. Бибкод : 2017PLoSO..1278458B. дои : 10.1371/journal.pone.0178458 . ISSN  1932-6203. ПМК 5456068 . ПМИД  28575009. 
  76. ^ Б. Цзян (2006). «Рейтинг пространств для прогнозирования движения человека в городской среде». Международный журнал географической информатики . 23 (7): 823–837. arXiv : физика/0612011 . Бибкод : 2009IJGIS..23..823J. дои : 10.1080/13658810802022822. S2CID  26880621.
  77. ^ Цзян Б.; Чжао С. и Инь Дж. (2008). «Самоорганизующиеся естественные дороги для прогнозирования транспортных потоков: исследование чувствительности». Журнал статистической механики: теория и эксперимент . P07008 (7): 008. arXiv : 0804.1630 . Бибкод : 2008JSMTE..07..008J. дои : 10.1088/1742-5468/2008/07/P07008. S2CID  118605727.
  78. ^ Роберто Навильи, Мирелла Лапата. «Экспериментальное исследование связности графов для неконтролируемого устранения неоднозначности смысла слов». Архивировано 14 декабря 2010 г. в Wayback Machine . Транзакции IEEE по анализу шаблонов и машинному интеллекту (TPAMI), 32 (4), IEEE Press, 2010, стр. 678–692.
  79. ^ М.Т. Пилевар, Д. Юргенс и Р. Навильи. Выравнивание, устранение неоднозначности и обход: унифицированный подход к измерению семантического сходства. Архивировано 1 октября 2013 г. в Wayback Machine . Учеб. 51-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2013), София, Болгария, 4–9 августа 2013 г., стр. 1341-1351.
  80. ^ Андреа Эсули и Фабрицио Себастьяни. «Синсеты WordNet для ранжирования страниц: приложение к свойствам, связанным с мнениями» (PDF) . В протоколах 35-го собрания Ассоциации компьютерной лингвистики, Прага, Чехия, 2007 г., стр. 424–431 . Архивировано (PDF) из оригинала 28 июня 2007 г. Проверено 30 июня 2007 г.
  81. ^ Ван С.; Шрекенберг М.; Гур Т (2023). «Переходы между квазистационарными состояниями в транспортных системах: на примере Кельнских орбитальных автомагистралей». Журнал статистической механики: теория и эксперимент . 2023 (9): 093401. arXiv : 2302.14596 . Бибкод : 2023JSMTE2023i3401W. дои : 10.1088/1742-5468/acf210 . S2CID  257232659.
  82. ^ «Предотвращение спама в комментариях» . Google . Архивировано из оригинала 12 июня 2005 года . Проверено 1 января 2005 г.
  83. ^ «Формирование PageRank: анализ ценности и потенциальных преимуществ формирования PR с помощью Nofollow» . SEOмоз. 14 октября 2008 г. Архивировано из оригинала 14 мая 2011 г. Проверено 27 мая 2011 г.
  84. ^ "Формирование PageRank" . Mattcutts.com. 15 июня 2009 г. Архивировано из оригинала 11 мая 2011 г. Проверено 27 мая 2011 г.

Источники

Соответствующие патенты

Внешние ссылки