Безмасштабная сеть — это сеть , распределение степеней которой подчиняется степенному закону , по крайней мере асимптотически. То есть доля P ( k ) узлов в сети, имеющих k соединений с другими узлами, соответствует большим значениям k как
где — параметр, значение которого обычно находится в диапазоне (где второй момент ( параметр масштаба ) бесконечен, а первый момент конечен), хотя иногда он может лежать за пределами этих границ. [1] [2] Название «безмасштабная» можно объяснить тем, что некоторые моменты распределения степеней не определены, поэтому сеть не имеет характерного масштаба или «размера».
Сообщается, что многие сети не имеют масштаба, хотя статистический анализ опроверг многие из этих утверждений и серьезно поставил под сомнение другие. [3] [4] Кроме того, некоторые утверждают, что просто знать, что распределение степеней имеет « толстый хвост» , важнее, чем знать, является ли сеть безмасштабной в соответствии со статистически строгими определениями. [5] [6] Предпочтительное присоединение и модель пригодности были предложены в качестве механизмов для объяснения предполагаемого степенного распределения степеней в реальных сетях. Альтернативные модели, такие как суперлинейное предпочтительное присоединение и предпочтительное присоединение второго соседа, могут создавать временные безмасштабные сети, но распределение степеней отклоняется от степенного закона, поскольку сети становятся очень большими. [7] [8]
Изучая сети цитирования между научными статьями, Дерек де Солла Прайс в 1965 году показал, что количество ссылок на статьи (т. е. количество полученных ими цитирований) имеет распределение с тяжелым хвостом, соответствующее распределению Парето или степенному закону , и таким образом, сеть цитирования не имеет масштаба. Однако он не использовал термин «безмасштабная сеть», который был придуман лишь несколько десятилетий спустя. В более поздней статье 1976 года Прайс также предложил механизм, объясняющий возникновение степенных законов в сетях цитирования, который он назвал «кумулятивным преимуществом», но который сегодня более известен под названием « предпочтительная привязанность» .
Недавний интерес к безмасштабным сетям начался в 1999 году с работы Альберта-Ласло Барабаси и Реки Альберт из Университета Нотр-Дам , которые нанесли на карту топологию части Всемирной паутины и обнаружили, что некоторые узлы, которые они назвали «концентраторы» имели гораздо больше соединений, чем другие, и что сеть в целом имела степенное распределение количества ссылок, подключающихся к узлу. Обнаружив, что несколько других сетей, в том числе некоторые социальные и биологические сети, также имеют распределение степеней с тяжелым хвостом, Барабаши и Река Альберт ввели термин «безмасштабная сеть», чтобы описать класс сетей, которые демонстрируют степенное распределение степеней. . Однако, изучая семь примеров сетей в социальных, экономических, технологических, биологических и физических системах, Амарал и др. не смогли найти безмасштабную сеть среди этих семи примеров. Только один из этих примеров, сеть киноактеров, имела распределение степеней P ( k ) в соответствии со степенным режимом для умеренных k , хотя в конечном итоге за этим степенным режимом последовал резкий срез, демонстрирующий экспоненциальное затухание для больших k . [10]
Барабаши и Река Альберт предложили генеративный механизм для объяснения появления степенных распределений, который они назвали « предпочтительной привязанностью » и который по существу аналогичен механизму, предложенному Прайсом. Аналитические решения для этого механизма (также аналогичные решению Прайса) были представлены в 2000 году Дороговцевым, Мендесом и Самухиным [11] и независимо Крапивским, Реднером и Лейврасом, а позже строго доказаны математиком Белой Боллобасом . [12] Примечательно, однако, что этот механизм создает только определенное подмножество сетей безмасштабного класса, и с тех пор было обнаружено множество альтернативных механизмов. [13]
История безмасштабных сетей также включает в себя некоторые разногласия. На эмпирическом уровне безмасштабная природа некоторых сетей была поставлена под сомнение. Например, три брата Фалуцос считали, что Интернет имеет степенное распределение степеней на основе данных трассировки ; однако было высказано предположение, что это иллюзия уровня 3 , создаваемая маршрутизаторами, которые выглядят как узлы высокого уровня, скрывая при этом внутреннюю структуру уровня 2 AS , которые они соединяют.[14]
На теоретическом уровне были предложены уточнения абстрактного определения безмасштабности. Например, Ли и др. (2005) предложили потенциально более точную «безмасштабную метрику». Кратко, пусть G — граф с множеством ребер E и обозначает степень вершины (то есть количество ребер, инцидентных ) через . Определять
Это максимизируется, когда узлы высокого уровня соединены с другими узлами высокого уровня. Теперь определите
где s max — максимальное значение s ( H ) для H в наборе всех графов с распределением степеней, идентичным распределению G. Это дает метрику от 0 до 1, где граф G с малым S ( G ) является «богатым по масштабу», а граф G с S ( G ) близким к 1 является «безмасштабным». Это определение отражает понятие самоподобия , подразумеваемое в названии «безмасштабный».
Когда концепция «безмасштабности» была первоначально введена в контексте сетей, [9] она в первую очередь относилась к конкретной характеристике: степенному распределению для данной переменной , выраженному как . Это свойство сохраняет свою форму при непрерывном масштабном преобразовании , что вызывает параллели с методами ренормгруппы в статистической теории поля. [15] [16]
Однако есть ключевое отличие. В статистической теории поля термин «масштаб» часто относится к размеру системы. В сфере сетей «масштаб» — это мера связности, обычно определяемая степенью узла, то есть количеством подключенных к нему связей. Считается, что сети с большим количеством узлов высокого уровня имеют большую связность.
Степенное распределение степеней позволяет нам делать «безмасштабные» утверждения о преобладании узлов высокой степени. [17] Например, мы можем сказать, что «узлы со средней связностью в три раза встречаются вдвое реже, чем узлы со средней связностью». Конкретное числовое значение того, что представляет собой «средняя связность», становится неважным, будь то сто или миллион. [18]
Наиболее примечательной характеристикой безмасштабной сети является относительная общность вершин со степенью, значительно превышающей среднюю. Узлы высшего уровня часто называют «концентраторами», и считается, что они служат определенным целям в своих сетях, хотя это во многом зависит от домена.
Другой важной характеристикой безмасштабных сетей является распределение коэффициента кластеризации , которое уменьшается с увеличением степени узла. Это распределение также подчиняется степенному закону. Это означает, что узлы низкой степени принадлежат очень плотным подграфам, и эти подграфы связаны друг с другом через концентраторы. Рассмотрим социальную сеть, в которой узлами являются люди, а ссылками — отношения знакомств между людьми. Легко заметить, что люди склонны образовывать сообщества, т. е. небольшие группы, в которых все всех знают (такое сообщество можно рассматривать как полный граф ). Кроме того, члены сообщества также имеют некоторые знакомые отношения с людьми за пределами этого сообщества. Однако некоторые люди связаны с большим количеством сообществ (например, знаменитости, политики). Этих людей можно считать центрами, ответственными за феномен маленького мира .
В настоящее время более конкретные характеристики безмасштабных сетей различаются в зависимости от генеративного механизма, используемого для их создания. Например, сети, созданные путем предпочтительного присоединения, обычно размещают вершины высокого уровня в середине сети, соединяя их вместе, образуя ядро, а узлы постепенно более низкого уровня составляют области между ядром и периферией. Случайное удаление даже большой части вершин очень мало влияет на общую связность сети, что позволяет предположить, что такие топологии могут быть полезны для безопасности , в то время как целевые атаки очень быстро разрушают связность. Другие безмасштабные сети, в которых вершины высокой степени располагаются на периферии, не обладают этими свойствами. Аналогично, коэффициент кластеризации безмасштабных сетей может существенно различаться в зависимости от других топологических деталей.
Вопрос о том, как иммунизировать эффективно масштабируемые свободные сети, которые представляют собой реалистичные сети, такие как Интернет и социальные сети, широко изучен. Одной из таких стратегий является иммунизация узлов наибольшей степени, т.е. целевые (намеренные) атаки, поскольку в этом случае p относительно велико и для иммунизации требуется меньше узлов. Однако во многих реальных случаях глобальная структура недоступна и узлы наибольшей степени неизвестны.
Свойства случайного графа могут изменяться или оставаться неизменными при преобразованиях графа. Машаги А. и др., например, продемонстрировали, что преобразование, которое преобразует случайные графы в их двойные по ребрам графы (или линейные графы), создает ансамбль графов с почти таким же распределением степеней, но с корреляциями степеней и значительно более высокой кластеризацией. коэффициент. Безмасштабные графы как таковые остаются безмасштабными при таких преобразованиях. [19]
Хотя многие реальные сети считаются безмасштабными, доказательства часто остаются неубедительными, в первую очередь из-за растущего понимания более строгих методов анализа данных. [3] Таким образом, безмасштабность многих сетей все еще обсуждается научным сообществом. Вот несколько примеров сетей, которые, как утверждается, являются безмасштабными:
Безмасштабная топология была также обнаружена в высокотемпературных сверхпроводниках. [23] Качества высокотемпературного сверхпроводника — соединения, в котором электроны подчиняются законам квантовой физики и движутся идеально синхронно, без трения — по-видимому, связаны с фрактальным расположением, казалось бы, случайных атомов кислорода и искажением решетки. [24]
Недавно была предложена заполняющая пространство ячеистая структура, взвешенная плоская стохастическая решетка (WPSL), распределение координационных чисел которой подчиняется степенному закону. Это означает, что решетка имеет несколько блоков, имеющих удивительно большое количество соседей, с которыми они имеют общие границы. Его построение начинается с инициатора, скажем, квадрата единичной площади, и генератора, который случайным образом делит его на четыре блока. После этого генератор последовательно применяется снова и снова только к одному из доступных блоков, выбранному предпочтительно по отношению к их площадям. В результате площадь разбивается на все более мелкие взаимоисключающие прямоугольные блоки. Двойник WPSL (DWPSL), который получается заменой каждого блока узлом в его центре и каждой общей границы между блоками ребром, соединяющим две соответствующие вершины, представляет собой сеть, распределение степеней которой подчиняется степенному закону. . [25] [26] Причина этого в том, что он растет в соответствии с правилом модели привязанности, основанной на посредничестве, которое также воплощает в себе правило предпочтительной привязанности, но замаскированное.
Безмасштабные сети возникают не случайно. Эрдеш и Реньи (1960) исследовали модель роста графов, в которой на каждом шаге два узла выбираются равномерно случайным образом и между ними вставляется связь. Свойства этих случайных графов отличаются от свойств безмасштабных сетей, поэтому необходима модель этого процесса роста.
Наиболее широко известной генеративной моделью для подмножества безмасштабных сетей является генеративная модель Барабаши и Альберта (1999), в которой каждая новая веб-страница создает ссылки на существующие веб-страницы с распределением вероятностей, которое не является равномерным, а пропорционально текущий уровень веб-страниц. Эта модель была первоначально изобретена Дереком Дж. де Солла Прайсом в 1965 году под термином «кумулятивное преимущество» , но не достигла популярности, пока Барабаси заново не открыл результаты под своим нынешним названием ( модель BA ). Согласно этому процессу, страница с большим количеством входящих ссылок будет привлекать больше входящих ссылок, чем обычная страница. Это генерирует степенной закон, но полученный граф отличается от фактического веб-графа другими свойствами, такими как наличие небольших тесно связанных сообществ. Были предложены и изучены более общие модели и характеристики сети. Например, Пачон и др. (2018) предложили вариант генеративной модели «богатые становятся богаче» , которая учитывает два разных правила прикрепления: механизм преимущественного прикрепления и единый выбор только для самых последних узлов. [27] Обзор см. в книге Дороговцева и Мендеса . [ нужна цитата ] Некоторые механизмы, такие как суперлинейное предпочтительное присоединение и присоединение второго соседа, создают сети, которые временно не масштабируются, но отклоняются от степенного закона по мере того, как сети становятся большими. [7] [8]
Несколько иная генеративная модель веб-ссылок была предложена Pennock et al. (2002). Они исследовали сообщества, интересующиеся определенной темой, такие как домашние страницы университетов, государственных компаний, газет или ученых, и отбросили основные центры Интернета. В этом случае распределение ссылок уже не было степенным законом, а напоминало нормальное распределение . Основываясь на этих наблюдениях, авторы предложили генеративную модель, которая сочетает предпочтительную привязанность с базовой вероятностью получения ссылки.
Другая генеративная модель — это модель копирования , изученная Кумаром и др. [28] (2000), в котором новые узлы выбирают существующий узел случайным образом и копируют часть ссылок существующего узла. Это также порождает степенной закон.
Есть два основных компонента, которые объясняют появление степенного распределения в модели Барабаши-Альберта : рост и преференциальная привязанность. [29] Под «ростом» подразумевается процесс роста, при котором в течение длительного периода времени новые узлы присоединяются к уже существующей системе, сети (например, Всемирной паутине, которая за 10 лет выросла на миллиарды веб-страниц). Наконец, под «предпочтительным присоединением» подразумевается, что новые узлы предпочитают подключаться к узлам, которые уже имеют большое количество связей с другими. Таким образом, существует более высокая вероятность того, что все больше и больше узлов будут связываться с тем узлом, который уже имеет много ссылок, что в конечном итоге приведет этот узел к хабу . [9] В зависимости от сети концентраторы могут быть ассортативными или неассортативными. Ассортативность можно обнаружить в социальных сетях, в которых люди с хорошими связями/известные люди, как правило, лучше узнают друг друга. Дисассортативность может быть обнаружена в технологических (Интернет, Всемирная паутина) и биологических (взаимодействие белков, метаболизм) сетях. [29]
Однако рост сетей (добавление новых узлов) не является необходимым условием для создания безмасштабной сети (см. Дангальчев [30] ). Одна из возможностей (Калдарелли и др., 2002) состоит в том, чтобы рассматривать структуру как статическую и рисовать связь между вершинами в соответствии с конкретным свойством двух задействованных вершин. После определения статистического распределения этих свойств вершин (пригодностей) оказывается, что в некоторых случаях статические сети также приобретают безмасштабные свойства.
Произошел всплеск активности в моделировании безмасштабных сложных сетей . Рецепт Барабаши и Альберта [31] сопровождался несколькими вариациями и обобщениями [32] [33] [34] [35] [27] и переработкой предыдущих математических работ. [36]
С современной точки зрения, если сложная сеть имеет степенное распределение любой из своих метрик, она обычно считается безмасштабной сетью. Аналогично, любая модель с этой особенностью называется безмасштабной моделью. [17]
Многие реальные сети (приблизительно) безмасштабны и, следовательно, для их описания требуются безмасштабные модели. В схеме Прайса для построения безмасштабной модели необходимы два ингредиента:
1. Добавление или удаление узлов . Обычно мы концентрируемся на расширении сети, то есть добавлении узлов.
2. Предпочтительное присоединение : вероятность того, что новые узлы будут подключены к «старому» узлу.
Обратите внимание, что некоторые модели (см. Дангалчева [30] и модель Фитнеса ниже) могут работать также статически, без изменения количества узлов. Следует также иметь в виду, что тот факт, что модели «предпочтительного прикрепления» приводят к появлению безмасштабных сетей, не доказывает, что это механизм, лежащий в основе эволюции реальных безмасштабных сетей, поскольку могут существовать различные механизмы в работать в реальных системах, которые, тем не менее, приводят к масштабированию.
Было предпринято несколько попыток создать безмасштабные сетевые свойства. Вот некоторые примеры:
Модель Барабаши -Альберта , ненаправленная версия модели Прайса, имеет линейное предпочтительное присоединение и добавляет один новый узел на каждом временном шаге.
(Обратите внимание, что еще одной общей особенностью в реальных сетях является то, что , т. е. существует ненулевая вероятность того, что новый узел присоединяется к изолированному узлу. Таким образом, в общем случае имеет вид , где - начальная привлекательность узла.)
Дангалчев (см. [30] ) строит 2-L модель, учитывая важность каждого из соседей целевого узла в предпочтительном присоединении. Привлекательность узла в модели 2-L зависит не только от количества связанных с ним узлов, но и от количества связей в каждом из этих узлов.
где C — коэффициент от 0 до 1.
Вариант модели 2-L, модель k2, в которой первый и второй соседние узлы в равной степени способствуют привлекательности целевого узла, демонстрирует появление переходных безмасштабных сетей. [8] В модели k2 распределение степеней выглядит приблизительно безмасштабным, пока сеть относительно мала, но значительные отклонения от безмасштабного режима возникают по мере увеличения сети. Это приводит к тому, что относительная привлекательность узлов разной степени меняется со временем, что также наблюдается в реальных сетях.
В модели привязанности, управляемой посредничеством (MDA) , новый узел, имеющий ребра, случайным образом выбирает существующий подключенный узел, а затем соединяется не с ним, а с одним из своих соседей, также выбранных случайным образом. Вероятность того, что выбран узел существующего узла, равна
Фактор является обратным гармоническому среднему (IHM) степеней соседей узла . Обширные численные исследования показывают, что приблизительно среднее значение IHM в большом пределе становится константой, что означает . Это означает, что чем выше уровень связей (уровня) узла, тем выше его шансы получить больше связей, поскольку они могут быть достигнуты большим количеством способов через посредников, что, по сути, воплощает интуитивную идею механизма «богатые становятся богаче» (или предпочтительного механизма богатства). правило прикрепления модели Барабаши–Альберта). Таким образом, можно увидеть, что сеть MDA следует правилу PA, но замаскировано. [37]
Тем не менее, поскольку он описывает весь механизм, победитель получает все, поскольку мы обнаруживаем, что большая часть всех узлов имеет степень один, а один - сверхбогатый по степени. По мере увеличения стоимости неравенство между сверхбогатыми и бедными уменьшается, и по мере того, как мы обнаруживаем механизм перехода от «богатые становятся супербогаче» к «богатые становятся еще богаче».
Модель Барабаши-Альберта предполагает, что вероятность того, что узел присоединяется к узлу, пропорциональна степени узла . Это предположение предполагает две гипотезы: во-первых, это зависит от , в отличие от случайных графов, в которых , и во-вторых, что функциональная форма линейна по .
При нелинейном предпочтительном прикреплении форма не является линейной, и недавние исследования показали, что распределение степеней сильно зависит от формы функции
Крапивский, Реднер и Лейвраз [34] демонстрируют, что безмасштабная природа сети разрушается при нелинейном предпочтительном присоединении. Единственный случай, когда топология сети не масштабируется, — это случай, когда предпочтительное присоединение асимптотически линейно, т. е. как . В этом случае уравнение скорости приводит к
Таким образом, показатель степени распределения можно настроить на любое значение от 2 до . [ нужны разъяснения ]
Иерархические сетевые модели по своей конструкции не масштабируются и имеют высокую кластеризацию узлов. [38]
Итеративное построение приводит к иерархической сети. Начиная с полностью связанного кластера из пяти узлов, мы создаем четыре идентичные реплики, соединяющие периферийные узлы каждого кластера с центральным узлом исходного кластера. Отсюда мы получаем сеть из 25 узлов ( N = 25). Повторяя тот же процесс, мы можем создать еще четыре реплики исходного кластера — четыре периферийных узла каждого из них подключаются к центральному узлу узлов, созданных на первом этапе. Это дает N = 125, и процесс может продолжаться бесконечно.
Идея состоит в том, что связь между двумя вершинами назначается не случайно с вероятностью p , одинаковой для всех пар вершин. Скорее, для каждой вершины j существует внутренняя пригодность x j , и связь между вершинами i и j создается с вероятностью . [39] В случае Всемирной торговой сети можно реконструировать все свойства, используя в качестве показателей пригодности страны их ВВП и принимая
Предполагая, что сеть имеет базовую гиперболическую геометрию, можно использовать структуру пространственных сетей для генерации безмасштабных распределений степеней. Это неоднородное распределение степеней затем просто отражает отрицательную кривизну и метрические свойства базовой гиперболической геометрии. [41]
Начав с безмасштабных графов с низкой степенью корреляции и коэффициентом кластеризации, можно создать новые графы с гораздо более высокой степенью корреляции и коэффициентами кластеризации, применив двойственное преобразование. [19]
Модель UPA представляет собой вариант модели предпочтительной привязанности (предложенной Пахоном и др.), которая учитывает два разных правила привязанности: механизм предпочтительной привязанности (с вероятностью 1-p), который подчеркивает систему «богатые становятся богаче», и единый выбор. (с вероятностью p) для самых последних узлов. Эта модификация интересна для изучения устойчивости безмасштабного поведения распределения степеней. Аналитически доказано, что асимптотически степенное распределение степеней сохраняется. [27]
В контексте теории сетей безмасштабная идеальная сеть — это случайная сеть с распределением степеней , соответствующим безмасштабному распределению плотности идеального газа . Эти сети способны воспроизводить распределение по размерам городов и результаты выборов, раскрывая распределение социальных групп по размерам с помощью теории информации в сложных сетях, когда к сети применяется процесс конкурентного роста кластеров. [42] [43] В моделях безмасштабных идеальных сетей можно продемонстрировать, что число Данбара является причиной явления, известного как « шесть степеней разделения ».
Для безмасштабной сети с узлами и показателем степени индуцированный подграф, построенный вершинами со степенями больше, чем является безмасштабной сетью с , почти наверняка . [44]
Оценка показателя степенного закона безмасштабной сети обычно выполняется с использованием оценки максимального правдоподобия со степенями нескольких узлов с равномерной выборкой. [3] Однако, поскольку при равномерной выборке недостаточно выборок из важного тяжелого хвоста степенного распределения степеней, этот метод может привести к большой погрешности и дисперсии. Недавно было предложено отбирать случайных друзей (то есть случайные концы случайных связей), которые с большей вероятностью происходят из хвоста распределения степеней в результате парадокса дружбы . [45] [46] Теоретически оценка максимального правдоподобия со случайными друзьями приводит к меньшему смещению и меньшей дисперсии по сравнению с классическим подходом, основанным на равномерной выборке. [46]