Безмасштабная сеть — это сеть , распределение степеней которой следует степенному закону , по крайней мере асимптотически. То есть, доля P ( k ) узлов в сети, имеющих k соединений с другими узлами, для больших значений k имеет вид
где — параметр, значение которого обычно находится в диапазоне (где второй момент ( параметр масштаба ) бесконечен, а первый момент конечен), хотя иногда он может лежать за этими пределами. [1] [2] Название «безмасштабный» можно объяснить тем фактом, что некоторые моменты распределения степеней не определены, так что сеть не имеет характерного масштаба или «размера».
Сообщалось, что многие сети не зависят от масштаба, хотя статистический анализ опроверг многие из этих утверждений и серьезно поставил под сомнение другие. [3] [4] Кроме того, некоторые утверждали, что простое знание того, что распределение степеней имеет толстый хвост, важнее, чем знание того, является ли сеть независимой от масштаба согласно статистически строгим определениям. [5] [6] Предпочтительное присоединение и модель приспособленности были предложены в качестве механизмов для объяснения предполагаемых распределений степенного закона в реальных сетях. Альтернативные модели, такие как сверхлинейное предпочтительное присоединение и предпочтительное присоединение второго соседа, могут, по-видимому, генерировать временные сети без масштаба, но распределение степеней отклоняется от степенного закона, когда сети становятся очень большими. [7] [8]
В исследованиях сетей цитирования между научными статьями Дерек де Солла Прайс в 1965 году показал, что число ссылок на статьи, т. е. число цитирований, которые они получают, имеет распределение с тяжелым хвостом, следующее за распределением Парето или степенным законом , и, таким образом, сеть цитирования является безмасштабной. Однако он не использовал термин «сеть безмасштабного характера», который был введен лишь несколько десятилетий спустя. В более поздней статье в 1976 году Прайс также предложил механизм для объяснения возникновения степенных законов в сетях цитирования, который он назвал «кумулятивным преимуществом», но который сегодня более известен под названием предпочтительное присоединение .
Недавний интерес к сетям без масштабирования начался в 1999 году с работы Альберта-Ласло Барабаши и Реки Альберта из Университета Нотр-Дам, которые составили карту топологии части Всемирной паутины [9], обнаружив, что некоторые узлы, которые они назвали «хабами», имели гораздо больше соединений, чем другие, и что сеть в целом имела степенное распределение числа связей, соединяющихся с узлом. После обнаружения того, что несколько других сетей, включая некоторые социальные и биологические сети, также имели распределение степеней с тяжелыми хвостами, Барабаши и Река Альберт ввели термин «сеть без масштабирования» для описания класса сетей, которые демонстрируют степенное распределение степеней. Однако, изучив семь примеров сетей в социальных, экономических, технологических, биологических и физических системах, Амарал и др. не смогли найти сеть без масштабирования среди этих семи примеров. Только один из этих примеров, сеть киноактера, имела распределение степеней P ( k ), следующее степенному закону для умеренных k , хотя в конечном итоге за этим степенным законом последовало резкое обрезание, показывающее экспоненциальный спад для больших k . [10]
Барабаши и Река Альберт предложили генеративный механизм для объяснения появления степенных распределений, который они назвали « предпочтительным присоединением » и который по сути совпадает с предложенным Прайсом. Аналитические решения для этого механизма (также похожие на решение Прайса) были представлены в 2000 году Дороговцевым, Мендесом и Самухиным [11] и независимо Крапивским, Реднером и Лейвразом, а позже строго доказаны математиком Белой Боллобашем . [12] Примечательно, однако, что этот механизм создает только определенное подмножество сетей в классе безмасштабных сетей, и с тех пор было обнаружено много альтернативных механизмов. [13]
История сетей без масштабирования также включает в себя некоторые разногласия. На эмпирическом уровне под вопрос ставится природа нескольких сетей без масштабирования. Например, три брата Фалуцос считали, что Интернет имеет распределение степенного закона на основе данных трассировки маршрута ; однако было высказано предположение, что это иллюзия уровня 3 , созданная маршрутизаторами, которые выглядят как узлы высокого уровня, скрывая внутреннюю структуру уровня 2 AS , которые они соединяют. [14]
На теоретическом уровне были предложены уточнения абстрактного определения безмасштабности. Например, Ли и др. (2005) предложили потенциально более точную «метрику безмасштабности». Вкратце, пусть G — граф с множеством ребер E , и обозначим степень вершины (то есть количество ребер, инцидентных ) как . Определим
Это максимизируется, когда узлы высокой степени соединены с другими узлами высокой степени. Теперь определим
где s max — максимальное значение s ( H ) для H в наборе всех графов с распределением степеней, идентичным распределению G . Это дает метрику между 0 и 1, где граф G с малым S ( G ) является «масштабно-богатым», а граф G с S ( G ), близким к 1, является «масштабно-свободным». Это определение охватывает понятие самоподобия, подразумеваемое в названии «масштабно-свободный».
Когда концепция «безмасштабности» была первоначально введена в контексте сетей, [9] она в первую очередь относилась к определенной черте: степенному распределению для заданной переменной , выраженному как . Это свойство сохраняет свою форму при непрерывном масштабном преобразовании , вызывая параллели с методами ренормгруппы в статистической теории поля. [15] [16]
Однако есть ключевое различие. В статистической теории поля термин «масштаб» часто относится к размеру системы. В сфере сетей «масштаб» — это мера связности, обычно определяемая степенью узла, то есть числом связей, присоединенных к нему. Сети с большим числом узлов высокой степени считаются имеющими большую связность.
Распределение степенных степеней позволяет нам делать «безмасштабные» утверждения о распространенности узлов высокой степени. [17] Например, мы можем сказать, что «узлы с тройной средней связностью встречаются в два раза реже, чем узлы со средней связностью». Конкретное численное значение того, что составляет «среднюю связность», становится неважным, будь то сотня или миллион. [18]
Наиболее заметной характеристикой в безмасштабной сети является относительная общность вершин со степенью, которая значительно превышает среднюю. Узлы с наивысшей степенью часто называются «хабами» и, как считается, служат определенным целям в своих сетях, хотя это во многом зависит от домена.
Другой важной характеристикой сетей без масштабирования является распределение коэффициента кластеризации , которое уменьшается с ростом степени узла. Это распределение также следует степенному закону. Это подразумевает, что узлы с низкой степенью принадлежат к очень плотным подграфам, и эти подграфы связаны друг с другом через концентраторы. Рассмотрим социальную сеть, в которой узлы — это люди, а связи — это отношения знакомств между людьми. Легко увидеть, что люди склонны образовывать сообщества, т. е. небольшие группы, в которых все знают всех (можно представить такое сообщество как полный граф ). Кроме того, члены сообщества также имеют несколько отношений знакомств с людьми за пределами этого сообщества. Некоторые люди, однако, связаны с большим количеством сообществ (например, знаменитости, политики). Этих людей можно считать концентраторами, ответственными за феномен маленького мира .
В настоящее время более конкретные характеристики сетей без масштабирования различаются в зависимости от генеративного механизма, используемого для их создания. Например, сети, созданные с помощью предпочтительного присоединения, обычно размещают вершины высокой степени в середине сети, соединяя их вместе, чтобы сформировать ядро, с узлами все более низкой степени, составляющими области между ядром и периферией. Случайное удаление даже большой доли вершин очень мало влияет на общую связность сети, что позволяет предположить, что такие топологии могут быть полезны для безопасности , в то время как целенаправленные атаки разрушают связность очень быстро. Другие сети без масштабирования, которые размещают вершины высокой степени на периферии, не демонстрируют этих свойств. Аналогично, коэффициент кластеризации сетей без масштабирования может значительно различаться в зависимости от других топологических деталей.
Вопрос о том, как эффективно иммунизировать масштабируемые свободные сети, которые представляют собой реалистичные сети, такие как Интернет и социальные сети, был тщательно изучен. Одной из таких стратегий является иммунизация узлов с наибольшей степенью, т. е. целенаправленные (преднамеренные) атаки, поскольку в этом случае p относительно высок и требуется меньше узлов для иммунизации. Однако во многих реалистичных случаях глобальная структура недоступна, а узлы с наибольшей степенью неизвестны.
Свойства случайного графа могут изменяться или оставаться инвариантными при преобразованиях графа. Например, Машаги А. и др. продемонстрировали, что преобразование, которое преобразует случайные графы в их реберно-дуальные графы (или линейные графы), создает ансамбль графов с почти таким же распределением степеней, но с корреляциями степеней и значительно более высоким коэффициентом кластеризации. Графы без масштаба, как таковые, остаются без масштаба при таких преобразованиях. [19]
Хотя многие реальные сети считаются безмасштабными, доказательства часто остаются неубедительными, в первую очередь из-за развивающегося понимания более строгих методов анализа данных. [3] Таким образом, безмасштабная природа многих сетей все еще обсуждается научным сообществом. Несколько примеров сетей, которые, как утверждается, являются безмасштабными, включают:
Топология без масштабирования была также обнаружена в высокотемпературных сверхпроводниках. [23] Свойства высокотемпературного сверхпроводника — соединения, в котором электроны подчиняются законам квантовой физики и движутся в идеальной синхронности, без трения — по-видимому, связаны с фрактальным расположением, казалось бы, случайных атомов кислорода и искажением решетки. [24]
Недавно была предложена заполняющая пространство ячеистая структура, взвешенная плоская стохастическая решетка (WPSL), распределение координационных чисел которой следует степенному закону. Это подразумевает, что решетка имеет несколько блоков, которые имеют поразительно большое количество соседей, с которыми они разделяют общие границы. Ее построение начинается с инициатора, скажем, квадрата единичной площади, и генератора, который делит его случайным образом на четыре блока. После этого генератор последовательно применяется снова и снова только к одному из доступных блоков, выбранных предпочтительно относительно их площадей. Это приводит к разбиению квадрата на все меньшие взаимоисключающие прямоугольные блоки. Двойник WPSL (DWPSL), который получается путем замены каждого блока узлом в его центре, а каждой общей границы между блоками — ребром, соединяющим две соответствующие вершины, возникает как сеть, распределение степеней которой следует степенному закону. [25] [26] Причина этого в том, что она растет, следуя правилу модели присоединения, управляемой посредничеством , которое также воплощает правило предпочтительного присоединения, но в замаскированном виде.
Безмасштабные сети не возникают случайно. Эрдёш и Реньи (1960) изучали модель роста для графов, в которой на каждом шаге два узла выбираются равномерно случайным образом и между ними вставляется связь. Свойства этих случайных графов отличаются от свойств, обнаруженных в безмасштабных сетях, и поэтому необходима модель для этого процесса роста.
Наиболее широко известной генеративной моделью для подмножества сетей без масштабирования является генеративная модель «богатый — богатый» Барабаши и Альберта (1999) , в которой каждая новая веб-страница создает ссылки на существующие веб-страницы с распределением вероятностей, которое не является равномерным, но пропорциональным текущей степени вхождения веб-страниц. Эта модель была первоначально изобретена Дереком Дж. де Соллой Прайсом в 1965 году под термином «кумулятивное преимущество» , но не достигла популярности, пока Барабаши не переоткрыл результаты под ее нынешним названием ( модель BA ). Согласно этому процессу, страница с большим количеством входящих ссылок привлечет больше входящих ссылок, чем обычная страница. Это генерирует степенной закон, но полученный график отличается от фактического веб-графа другими свойствами, такими как наличие небольших тесно связанных сообществ. Были предложены и изучены более общие модели и характеристики сети. Например, Pachon et al. (2018) предложили вариант генеративной модели « богатые становятся богаче» , которая учитывает два разных правила прикрепления: предпочтительный механизм прикрепления и единообразный выбор только для самых последних узлов. [27] Обзор см. в книге Дороговцева и Мендеса . [ требуется ссылка ] Некоторые механизмы, такие как сверхлинейное предпочтительное присоединение и присоединение второго соседа, создают сети, которые временно не имеют масштаба, но отклоняются от степенного закона по мере роста сетей. [7] [8]
Несколько иная генеративная модель для веб-ссылок была предложена Пенноком и др. (2002). Они исследовали сообщества с интересами в определенной теме, например, домашние страницы университетов, публичных компаний, газет или ученых, и отбросили основные хабы Интернета. В этом случае распределение ссылок больше не было степенным законом, а напоминало нормальное распределение . Основываясь на этих наблюдениях, авторы предложили генеративную модель, которая смешивает предпочтительное присоединение с базовой вероятностью получения ссылки.
Другая генеративная модель — это модель копирования , изученная Кумаром и др. [28] (2000), в которой новые узлы выбирают существующий узел случайным образом и копируют часть связей существующего узла. Это также генерирует степенной закон.
Есть два основных компонента, которые объясняют возникновение степенного распределения в модели Барабаши–Альберта : рост и предпочтительное присоединение. [29] Под «ростом» подразумевается процесс роста, при котором в течение длительного периода времени новые узлы присоединяются к уже существующей системе, сети (например, Всемирной паутине, которая выросла на миллиарды веб-страниц за 10 лет). Наконец, под «предпочтительным присоединением» подразумевается, что новые узлы предпочитают подключаться к узлам, которые уже имеют большое количество связей с другими. Таким образом, существует более высокая вероятность того, что все больше и больше узлов будут связываться с тем, который уже имеет много связей, приводя этот узел к узлу в конечном итоге . [9] В зависимости от сети хабы могут быть либо ассортативными, либо дисассортативными. Ассортативность будет обнаружена в социальных сетях, в которых хорошо связанные/знаменитые люди, как правило, лучше знают друг друга. Дисассортативность будет обнаружена в технологических (Интернет, Всемирная паутина) и биологических (взаимодействие белков, метаболизм) сетях. [29]
Однако рост сетей (добавление новых узлов) не является необходимым условием для создания безмасштабной сети (см. Dangalchev [30] ). Одна из возможностей (Caldarelli et al. 2002) состоит в том, чтобы рассматривать структуру как статическую и проводить связь между вершинами в соответствии с определенным свойством двух вовлеченных вершин. После того, как определено статистическое распределение для этих свойств вершин (приспособленности), оказывается, что в некоторых обстоятельствах статические сети также развивают безмасштабные свойства.
Наблюдается всплеск активности в моделировании масштабно-независимых комплексных сетей . Рецепт Барабаши и Альберта [31] был продолжен несколькими вариациями и обобщениями [32] [33] [34] [35] [27] и переработкой предыдущих математических работ. [36]
В современных терминах, если сложная сеть имеет степенное распределение любой из своих метрик, она обычно считается безмасштабной сетью. Аналогично, любая модель с этой особенностью называется безмасштабной моделью. [17]
Многие реальные сети (приблизительно) безмасштабны и, следовательно, требуют безмасштабных моделей для их описания. В схеме Прайса для построения безмасштабной модели необходимы два ингредиента:
1. Добавление или удаление узлов . Обычно мы концентрируемся на расширении сети, т.е. добавлении узлов.
2. Предпочтительное присоединение : вероятность того, что новые узлы будут подключены к «старому» узлу.
Обратите внимание, что некоторые модели (см. Dangalchev [30] и Fitness model ниже) могут работать также статически, без изменения количества узлов. Следует также иметь в виду, что тот факт, что модели «предпочтительного присоединения» приводят к появлению безмасштабных сетей, не доказывает, что это механизм, лежащий в основе эволюции безмасштабных сетей в реальном мире, поскольку в системах реального мира могут работать различные механизмы, которые, тем не менее, приводят к масштабированию.
Было предпринято несколько попыток создания безмасштабных сетевых свойств. Вот несколько примеров:
Модель Барабаши–Альберта , ненаправленная версия модели Прайса, имеет линейное предпочтительное присоединение и добавляет один новый узел на каждом временном шаге.
(Обратите внимание, что еще одной общей особенностью в реальных сетях является то, что , т.е. существует ненулевая вероятность того, что новый узел присоединится к изолированному узлу. Таким образом, в общем случае имеет вид , где — начальная привлекательность узла.)
Дангалчев (см. [30] ) строит модель 2-L, рассматривая важность каждого из соседей целевого узла в предпочтительном присоединении. Привлекательность узла в модели 2-L зависит не только от количества узлов, связанных с ним, но и от количества связей в каждом из этих узлов.
где C — коэффициент от 0 до 1.
Вариант модели 2-L, модель k2, где первый и второй соседние узлы вносят равный вклад в привлекательность целевого узла, демонстрирует возникновение транзитных сетей без масштаба. [8] В модели k2 распределение степеней выглядит приблизительно без масштаба, пока сеть относительно мала, но значительные отклонения от режима без масштаба возникают по мере увеличения сети. Это приводит к тому, что относительная привлекательность узлов с разными степенями меняется со временем, что также наблюдается в реальных сетях.
В модели присоединения, управляемого посредничеством (MDA) , новый узел, приходящий с ребрами, выбирает существующий связанный узел случайным образом, а затем соединяется сам с собой, не с ним, а с его соседями, также выбранными случайным образом. Вероятность того, что выбран узел существующего узла, равна
Фактор является обратной величиной гармонического среднего (IHM) степеней соседей узла . Обширные численные исследования показывают, что для приблизительно среднего значения IHM в большом пределе становится константой, что означает . Это подразумевает, что чем выше связи (степень) у узла, тем выше его шанс получить больше связей, поскольку они могут быть достигнуты большим количеством способов через посредников, что по сути воплощает интуитивную идею механизма «богатый становится богаче» (или правило предпочтительного присоединения модели Барабаши–Альберта). Таким образом, можно увидеть, что сеть MDA следует правилу PA, но замаскированно. [37]
Однако, поскольку он описывает механизм «победитель получает все», мы обнаруживаем, что почти все узлы имеют степень один, а один является сверхбогатым по степени. По мере увеличения значения неравенство между сверхбогатыми и бедными уменьшается, и мы обнаруживаем переход от механизма «богатые становятся сверхбогатыми» к механизму «богатые становятся еще богаче».
Модель Барабаши–Альберта предполагает, что вероятность присоединения узла к узлу пропорциональна степени узла . Это предположение включает в себя две гипотезы: во-первых, что зависит от , в отличие от случайных графов, в которых , и, во-вторых, что функциональная форма линейна по .
При нелинейном предпочтительном присоединении форма нелинейна, и недавние исследования показали, что распределение степеней сильно зависит от формы функции
Крапивский, Реднер и Лейвраз [34] демонстрируют, что безмасштабная природа сети разрушается для нелинейного предпочтительного присоединения. Единственный случай, в котором топология сети является безмасштабной, это когда предпочтительное присоединение асимптотически линейно, т.е. как . В этом случае уравнение скорости приводит к
Таким образом, показатель степени распределения может быть настроен на любое значение от 2 до . [ необходимо разъяснение ]
Иерархические сетевые модели по своей сути не масштабируются и имеют высокую кластеризацию узлов. [38]
Итеративное построение приводит к иерархической сети. Начиная с полностью связанного кластера из пяти узлов, мы создаем четыре идентичные реплики, соединяющие периферийные узлы каждого кластера с центральным узлом исходного кластера. Из этого мы получаем сеть из 25 узлов ( N = 25). Повторяя тот же процесс, мы можем создать еще четыре реплики исходного кластера — четыре периферийных узла каждого из них соединяются с центральным узлом узлов, созданных на первом шаге. Это дает N = 125, и процесс может продолжаться бесконечно.
Идея заключается в том, что связь между двумя вершинами назначается не случайно с вероятностью p, равной для всех пар вершин. Скорее, для каждой вершины j существует внутренняя пригодность x j , а связь между вершинами i и j создается с вероятностью . [39] В случае Всемирной торговой сети можно реконструировать все свойства, используя в качестве пригодности страны ее ВВП и взяв
Предполагая, что сеть имеет базовую гиперболическую геометрию, можно использовать структуру пространственных сетей для генерации безмасштабных распределений степеней. Это неоднородное распределение степеней затем просто отражает отрицательную кривизну и метрические свойства базовой гиперболической геометрии. [41]
Начиная с графов без масштабирования с низкой степенью корреляции и коэффициентом кластеризации, можно генерировать новые графы с гораздо более высокой степенью корреляции и коэффициентом кластеризации, применяя двойственное по ребру преобразование. [19]
Модель UPA представляет собой вариант модели предпочтительного прикрепления (предложенной Пачоном и др.), которая учитывает два различных правила прикрепления: механизм предпочтительного прикрепления (с вероятностью 1−p), который напрягает систему «богатые становятся богаче», и равномерный выбор (с вероятностью p) для самых последних узлов. Эта модификация интересна для изучения надежности поведения распределения степеней без масштаба. Аналитически доказано, что асимптотически степенное распределение степеней сохраняется. [27]
В контексте теории сетей идеальная сеть без масштаба — это случайная сеть с распределением степеней , следующим за распределением плотности идеального газа без масштаба . Эти сети способны воспроизводить распределения размеров городов и результаты выборов, распутывая распределение размеров социальных групп с помощью теории информации в сложных сетях, когда к сети применяется процесс роста конкурентного кластера. [42] [43] В моделях идеальных сетей без масштаба можно продемонстрировать, что число Данбара является причиной явления, известного как « шесть степеней разделения ».
Для безмасштабной сети с узлами и показателем степенной зависимости индуцированный подграф, построенный вершинами со степенями, большими, чем , является безмасштабной сетью с , почти наверняка . [44]
Оценка показателя степени безмасштабной сети обычно выполняется с использованием оценки максимального правдоподобия со степенями нескольких равномерно выбранных узлов. [3] Однако, поскольку равномерная выборка не получает достаточного количества выборок из важного тяжелого хвоста распределения степенного закона, этот метод может дать большое смещение и дисперсию. Недавно было предложено выбирать случайных друзей (т. е. случайные концы случайных связей), которые с большей вероятностью попадают из хвоста распределения степеней в результате парадокса дружбы . [ 45] [46] Теоретически оценка максимального правдоподобия со случайными друзьями приводит к меньшему смещению и меньшей дисперсии по сравнению с классическим подходом, основанным на равномерной выборке. [46]