Сетевая наука — это академическая область, которая изучает сложные сети , такие как телекоммуникационные сети , компьютерные сети , биологические сети , когнитивные и семантические сети и социальные сети , рассматривая отдельные элементы или субъектов, представленных узлами (или вершинами ), и связи между элементами или субъектами как ссылки (или ребра ). Область опирается на теории и методы, включая теорию графов из математики, статистическую механику из физики, интеллектуальный анализ данных и визуализацию информации из компьютерной науки, инференциальное моделирование из статистики и социальную структуру из социологии. Национальный исследовательский совет США определяет сетевую науку как «изучение сетевых представлений физических, биологических и социальных явлений, приводящее к предиктивным моделям этих явлений». [1]
Изучение сетей возникло в различных дисциплинах как средство анализа сложных реляционных данных. Самая ранняя известная работа в этой области — знаменитая работа « Семь мостов Кёнигсберга», написанная Леонардом Эйлером в 1736 году. Математическое описание вершин и ребер Эйлером стало основой теории графов , раздела математики, изучающего свойства парных отношений в сетевой структуре. Область теории графов продолжала развиваться и нашла применение в химии (Сильвестр, 1878).
Денеш Кёниг , венгерский математик и профессор, написал первую книгу по теории графов под названием «Теория конечных и бесконечных графов» в 1936 году. [2]
В 1930-х годах в США прибыл Джейкоб Морено , психолог в традиции гештальт-психологии . Он разработал социограмму и представил ее публике в апреле 1933 года на съезде ученых-медиков. Морено утверждал, что «до появления социометрии никто не знал, как именно выглядит межличностная структура группы». [3] Социограмма представляла собой представление социальной структуры группы учеников начальной школы. Мальчики дружили с мальчиками, а девочки дружили с девочками, за исключением одного мальчика, который сказал, что ему нравится одна девочка. Чувство не было взаимным. Это сетевое представление социальной структуры было найдено настолько интригующим, что его напечатали в The New York Times . [4] Социограмма нашла множество применений и переросла в область анализа социальных сетей .
Вероятностная теория в сетевой науке развивалась как ответвление теории графов с восемью известными статьями Пола Эрдёша и Альфреда Реньи о случайных графах . Для социальных сетей экспоненциальная модель случайного графа или p* является нотационной структурой, используемой для представления вероятностного пространства связи, происходящей в социальной сети . Альтернативным подходом к структурам вероятности сети является матрица вероятности сети , которая моделирует вероятность появления ребер в сети на основе исторического наличия или отсутствия ребра в выборке сетей.
Интерес к сетям резко возрос около 2000 года после новых открытий, которые предложили новую математическую основу для описания различных топологий сетей, что привело к появлению термина «сетевая наука». Альберт-Ласло Барабаши и Река Альберт открыли природу безмасштабных сетей [5] многих реальных сетей, от WWW до ячейки. Свойство безмасштабности отражает тот факт, что в реальных сетевых концентраторах сосуществуют многие вершины малой степени, и авторы предложили динамическую модель для объяснения происхождения этого безмасштабного состояния [5] . Дункан Уоттс и Стивен Строгац согласовали эмпирические данные о сетях с математическим представлением, описав сеть малого мира . [6]
Определение детерминированной сети определяется по сравнению с определением вероятностной сети. В невзвешенных детерминированных сетях ребра либо существуют, либо нет, обычно мы используем 0 для представления отсутствия ребра, а 1 для представления наличия ребра. В взвешенных детерминированных сетях значение ребра представляет вес каждого ребра, например, уровень прочности.
В вероятностных сетях значения за каждым ребром представляют вероятность существования каждого ребра. Например, если одно ребро имеет значение, равное 0,9, мы говорим, что вероятность существования этого ребра равна 0,9. [7]
Часто сети имеют определенные атрибуты, которые можно вычислить для анализа свойств и характеристик сети. Поведение этих сетевых свойств часто определяет сетевые модели и может использоваться для анализа того, как определенные модели контрастируют друг с другом. Многие определения других терминов, используемых в сетевой науке, можно найти в Глоссарии теории графов .
Размер сети может относиться к числу узлов или, реже, к числу ребер , которое (для связных графов без множественных ребер) может варьироваться от (дерево) до (полный граф). В случае простого графа (сети, в которой между каждой парой вершин существует не более одного (неориентированного) ребра, и в которой ни одна вершина не соединяется сама с собой), мы имеем ; для направленных графов (без самосвязанных узлов), ; для направленных графов с разрешенными самосвязями, . В случае графа, в котором между парой вершин могут существовать множественные ребра, .
Плотность сети определяется как нормализованное отношение между 0 и 1 числа ребер к числу возможных ребер в сети с узлами. Плотность сети является мерой процента «необязательных» ребер, которые существуют в сети, и может быть вычислена как где и являются минимальным и максимальным числом ребер в связанной сети с узлами соответственно. В случае простых графов задается биномиальным коэффициентом и , что дает плотность . Другое возможное уравнение — тогда как связи являются однонаправленными (Wasserman & Faust 1994). [8] Это дает лучший обзор плотности сети, поскольку однонаправленные отношения могут быть измерены.
Плотность сети, в которой нет пересечений между ребрами, определяется как отношение числа ребер к числу возможных ребер в сети с узлами, заданной графом без пересекающихся ребер , что дает
Степень узла — это количество ребер, соединенных с ним. Тесно связана с плотностью сети средняя степень ( или, в случае ориентированных графов, бывший множитель 2, возникающий из каждого ребра в неориентированном графе, способствующий степени двух различных вершин). В модели случайного графа ER ( ) мы можем вычислить ожидаемое значение (равное ожидаемому значению произвольной вершины): случайная вершина имеет другие доступные вершины в сети и с вероятностью соединяется с каждой из них. Таким образом, .
Средняя длина кратчайшего пути вычисляется путем нахождения кратчайшего пути между всеми парами узлов и взятия среднего значения по всем путям его длины (длина представляет собой количество промежуточных ребер, содержащихся в пути, т. е. расстояние между двумя вершинами в графе). Это показывает нам, в среднем, количество шагов, которое требуется, чтобы добраться от одного члена сети до другого. Поведение ожидаемой средней длины кратчайшего пути (то есть среднего ансамбля средней длины кратчайшего пути) как функции количества вершин случайной сетевой модели определяет, демонстрирует ли эта модель эффект маленького мира; если она масштабируется как , модель генерирует сети маленького мира. При росте быстрее логарифмического модель не создает маленьких миров. Особый случай известен как эффект сверхмалого мира.
В качестве другого средства измерения сетевых графиков мы можем определить диаметр сети как самый длинный из всех вычисленных кратчайших путей в сети. Это самое короткое расстояние между двумя самыми удаленными узлами в сети. Другими словами, как только вычислена длина кратчайшего пути от каждого узла до всех других узлов, диаметр становится самым длинным из всех вычисленных длин путей. Диаметр представляет линейный размер сети. Если соединены узлы ABCD, то, идя от A->D, это будет диаметр 3 (3 перехода, 3 связи). [ необходима цитата ]
Коэффициент кластеризации является мерой свойства «все мои друзья знают друг друга». Иногда это описывается как друзья моих друзей — мои друзья. Точнее, коэффициент кластеризации узла — это отношение существующих связей, соединяющих соседей узла друг с другом, к максимально возможному числу таких связей. Коэффициент кластеризации для всей сети — это среднее значение коэффициентов кластеризации всех узлов. Высокий коэффициент кластеризации для сети — еще один признак того, что мир тесен .
Коэффициент кластеризации '-го узла равен
где - число соседей 'th узла, а - число соединений между этими соседями. Максимально возможное число соединений между соседями равно, тогда,
С вероятностной точки зрения ожидаемый локальный коэффициент кластеризации представляет собой вероятность существования связи между двумя произвольными соседями одного и того же узла.
Способ, которым соединена сеть, играет большую роль в том, как сети анализируются и интерпретируются. Сети классифицируются по четырем различным категориям:
Индексы центральности создают рейтинги, которые стремятся определить самые важные узлы в сетевой модели. Различные индексы центральности кодируют различные контексты для слова «важность». Например, центральность по промежуточности считает узел очень важным, если он образует мосты между многими другими узлами. Центральность по собственному значению , напротив, считает узел очень важным, если с ним связаны многие другие очень важные узлы. Сотни таких мер были предложены в литературе.
Индексы центральности точны только для определения наиболее важных узлов. Меры редко, если вообще когда-либо, имеют смысл для остальных узлов сети. [9] [10] Кроме того, их показания точны только в рамках их предполагаемого контекста важности и имеют тенденцию «неправильно понимать» для других контекстов. [11] Например, представьте себе два отдельных сообщества, единственной связью которых является ребро между самым младшим членом каждого сообщества. Поскольку любой переход из одного сообщества в другое должен проходить по этой связи, два младших члена будут иметь высокую центральность по промежуточности. Но, поскольку они младшие, (предположительно) у них мало связей с «важными» узлами в их сообществе, что означает, что их центральность по собственному значению будет довольно низкой.
Ограничения мер центральности привели к разработке более общих мер. Двумя примерами являются доступность , которая использует разнообразие случайных блужданий для измерения того, насколько доступна остальная часть сети из заданного начального узла, [12] и ожидаемая сила , полученная из ожидаемого значения силы заражения, генерируемого узлом. [9] Обе эти меры могут быть осмысленно вычислены только из структуры сети.
Узлы в сети могут быть разделены на группы, представляющие сообщества. В зависимости от контекста сообщества могут быть отдельными или перекрывающимися. Как правило, узлы в таких сообществах будут сильно связаны с другими узлами в том же сообществе, но слабо связаны с узлами вне сообщества. В отсутствие истинного описания структуры сообщества конкретной сети было разработано несколько алгоритмов для вывода возможных структур сообществ с использованием контролируемых или неконтролируемых методов кластеризации.
Сетевые модели служат основой для понимания взаимодействий в эмпирических сложных сетях. Различные модели генерации случайных графов создают сетевые структуры, которые можно использовать в сравнении с реальными сложными сетями.
Модель Эрдёша–Реньи , названная в честь Пола Эрдёша и Альфреда Реньи , используется для генерации случайных графов , в которых ребра устанавливаются между узлами с равными вероятностями. Она может использоваться в вероятностном методе для доказательства существования графов, удовлетворяющих различным свойствам, или для предоставления строгого определения того, что означает, что свойство выполняется почти для всех графов.
Для создания модели Эрдёша–Реньи необходимо указать два параметра: общее количество узлов n и вероятность p того, что случайная пара узлов имеет ребро.
Поскольку модель создается без смещения относительно конкретных узлов, распределение степеней является биномиальным: для случайно выбранной вершины ,
В этой модели коэффициент кластеризации равен 0 a.s. Поведение можно разбить на три области.
Докритический : Все компоненты простые и очень маленькие, самый большой компонент имеет размер ;
Критический : ;
Сверхкритический : где — положительное решение уравнения .
Самый большой связный компонент имеет высокую сложность. Все остальные компоненты простые и маленькие .
Модель конфигурации принимает последовательность степеней [13] [14] или распределение степеней [15] (которое впоследствии используется для генерации последовательности степеней) в качестве входных данных и производит случайно связанные графы во всех отношениях, кроме последовательности степеней. Это означает, что для заданного выбора последовательности степеней граф выбирается равномерно случайным образом из набора всех графов, которые соответствуют этой последовательности степеней. Степень случайно выбранной вершины является независимой и одинаково распределенной случайной величиной с целочисленными значениями. Когда , граф конфигурации содержит гигантский связный компонент , который имеет бесконечный размер. [14] Остальные компоненты имеют конечные размеры, которые можно количественно определить с помощью понятия распределения размеров. Вероятность того, что случайно выбранный узел соединен с компонентом размера, задается степенями свертки распределения степеней: [16] где обозначает распределение степеней и . Гигантский компонент может быть уничтожен путем случайного удаления критической доли всех ребер. Этот процесс называется перколяцией в случайных сетях . Когда второй момент распределения степеней конечен, , эта критическая доля ребер определяется как [17] , а среднее расстояние между вершинами в гигантском компоненте масштабируется логарифмически с общим размером сети, . [15]
В модели направленной конфигурации степень узла задается двумя числами, входящей и исходящей степенью , и, следовательно, распределение степеней является двумерным. Ожидаемое число входящих и исходящих ребер совпадает, так что . Модель направленной конфигурации содержит гигантский компонент тогда и только тогда, когда [18] Обратите внимание, что и равны и, следовательно, взаимозаменяемы в последнем неравенстве. Вероятность того, что случайно выбранная вершина принадлежит компоненту размера, задается как: [19] для входящих компонентов, и
для внешних компонентов.
Модель Уоттса и Строгаца — это модель случайной генерации графов, которая создает графы со свойствами тесного мира .
Для генерации модели Уоттса–Строгаца используется начальная решетчатая структура. Каждый узел в сети изначально связан со своими ближайшими соседями. Другой параметр указывается как вероятность переподключения. Каждое ребро имеет вероятность того, что оно будет переподключено к графу как случайное ребро. Ожидаемое количество переподключенных связей в модели равно .
Поскольку модель Уоттса–Строгаца начинается как неслучайная решетчатая структура, она имеет очень высокий коэффициент кластеризации наряду с высокой средней длиной пути. Каждая перевязка, вероятно, создаст сокращение между сильно связанными кластерами. По мере увеличения вероятности перевязки коэффициент кластеризации уменьшается медленнее, чем средняя длина пути. По сути, это позволяет средней длине пути сети значительно уменьшиться при лишь небольшом уменьшении коэффициента кластеризации. Более высокие значения p вызывают больше перевязанных ребер, что по сути делает модель Уоттса–Строгаца случайной сетью.
Модель Барабаши–Альберта — это случайная сетевая модель, используемая для демонстрации предпочтительного присоединения или эффекта «богатый становится богаче». В этой модели ребро, скорее всего, прикрепится к узлам с более высокими степенями. Сеть начинается с начальной сети из m 0 узлов. m 0 ≥ 2, а степень каждого узла в начальной сети должна быть не менее 1, в противном случае он всегда будет оставаться отсоединенным от остальной части сети.
В модели BA новые узлы добавляются в сеть по одному за раз. Каждый новый узел подключается к существующим узлам с вероятностью, пропорциональной количеству связей, которые уже есть у существующих узлов. Формально вероятность p i того, что новый узел подключен к узлу i, равна [20]
где k i — степень узла i . Сильно связанные узлы («хабы») имеют тенденцию быстро накапливать еще больше связей, в то время как узлы с небольшим количеством связей вряд ли будут выбраны в качестве места назначения для новой связи. Новые узлы имеют «предпочтение» присоединяться к уже сильно связанным узлам.
Распределение степеней, полученное в результате использования модели BA, не зависит от масштаба, в частности, для больших степеней оно представляет собой степенной закон вида:
Хабы демонстрируют высокую центральность промежуточности, что позволяет коротким путям существовать между узлами. В результате модель BA имеет тенденцию иметь очень короткие средние длины путей. Коэффициент кластеризации этой модели также стремится к 0.
Модель Барабаши–Альберта [21] была разработана для ненаправленных сетей с целью объяснить универсальность свойства безмасштабности и применена к широкому спектру различных сетей и приложений. Направленная версия этой модели — модель Прайса [22] [23] , которая была разработана только для сетей цитирования.
В нелинейном предпочтительном присоединении (NLPA) существующие узлы в сети получают новые ребра пропорционально степени узла, возведенной в постоянную положительную степень, . [24] Формально это означает, что вероятность того, что узел получит новое ребро, определяется как
Если , NLPA сводится к модели BA и называется «линейным». Если , NLPA называется «сублинейным», а распределение степеней сети стремится к растянутому экспоненциальному распределению . Если , NLPA называется «суперлинейным», а небольшое количество узлов соединяется почти со всеми другими узлами в сети. Для обоих и свойство масштабируемости сети нарушается в пределе бесконечного размера системы. Однако, если лишь немного больше , NLPA может привести к распределениям степеней , которые кажутся временно масштабируемыми. [25]
В модели присоединения с посредничеством (MDA) , в которой новый узел, приходящий с ребрами, выбирает существующий связанный узел случайным образом, а затем соединяется не с ним, а с его соседями, выбранными также случайным образом. Вероятность того, что узел существующего выбранного узла
Фактор является обратной величиной гармонического среднего (IHM) степеней соседей узла . Обширные численные исследования показывают, что для приблизительно среднее значение IHM в большом пределе становится константой, что означает . Это подразумевает, что чем выше связи (степень) у узла, тем выше его шанс получить больше связей, поскольку они могут быть достигнуты большим количеством способов через посредников, что по сути воплощает интуитивную идею механизма «богатый становится богаче» (или правило предпочтительного присоединения модели Барабаши–Альберта). Таким образом, можно увидеть, что сеть MDA следует правилу PA, но замаскированно. [26]
Однако, поскольку он описывает механизм «победитель получает все», мы обнаруживаем, что почти все узлы имеют степень один, а один является сверхбогатым по степени. По мере увеличения значения неравенство между сверхбогатыми и бедными уменьшается, и мы обнаруживаем переход от механизма «богатые становятся сверхбогатыми» к механизму «богатые становятся еще богаче».
Другая модель, где ключевым компонентом является природа вершины, была введена Калдарелли и др. [27] Здесь связь создается между двумя вершинами с вероятностью, заданной связывающей функцией пригодности вовлеченных вершин. Степень вершины i задается как [28]
Если — обратимая и возрастающая функция , то распределение вероятностей определяется выражением
В результате, если приспособленности распределены по степенному закону, то и степень узла распределена по степенному закону.
Менее интуитивно с быстро убывающим распределением вероятностей, как вместе с функцией связывания вида
с константой и функцией Хэвисайда мы также получаем безмасштабные сети.
Такая модель успешно применялась для описания торговли между странами, используя ВВП как соответствие различным узлам и связующую функцию такого рода [29] [30]
Экспоненциальные случайные графовые модели (ERGM) — это семейство статистических моделей для анализа данных из социальных и других сетей. [31] Экспоненциальное семейство — это широкое семейство моделей, охватывающее многие типы данных, а не только сети. ERGM — это модель из этого семейства, которая описывает сети.
Мы принимаем обозначение для представления случайного графа с помощью набора узлов и коллекции связующих переменных , индексированных парами узлов , где , если узлы соединены ребром, и , в противном случае.
Основное предположение ERGM заключается в том, что структура в наблюдаемом графе может быть объяснена заданным вектором достаточной статистики , которая является функцией наблюдаемой сети и, в некоторых случаях, узловых атрибутов. Вероятность графа в ERGM определяется как:
где — вектор параметров модели, связанный с , а — нормирующая константа.
Анализ социальных сетей изучает структуру отношений между социальными сущностями. [32] Эти сущности часто являются людьми, но также могут быть группами , организациями , национальными государствами , веб-сайтами , научными публикациями .
С 1970-х годов эмпирическое изучение сетей играет центральную роль в социальных науках, и многие из математических и статистических инструментов, используемых для изучения сетей, были впервые разработаны в социологии . [33] Среди многих других приложений анализ социальных сетей использовался для понимания распространения новостей и слухов. Аналогичным образом, он использовался для изучения распространения как болезней , так и поведения, связанного со здоровьем . Он также применялся к изучению рынков , где он использовался для изучения роли доверия в отношениях обмена и социальных механизмов в установлении цен. Аналогичным образом, он использовался для изучения вербовки в политические движения и общественные организации. Он также использовался для концептуализации научных разногласий, а также академического престижа. Совсем недавно сетевой анализ (и его близкий родственник анализ трафика ) получил значительное применение в военной разведке для раскрытия повстанческих сетей как иерархического, так и беслидерного характера. [34] [35] В криминологии он используется для выявления влиятельных участников преступных группировок, преступных движений, соучастников преступлений, прогнозирования преступной деятельности и разработки политики. [36]
Динамический сетевой анализ изучает изменяющуюся структуру взаимоотношений между различными классами сущностей в сложных социально-технических системах и отражает социальную стабильность и изменения, такие как появление новых групп, тем и лидеров. [37] [38] [39] Динамический сетевой анализ фокусируется на метасетях, состоящих из нескольких типов узлов (сущностей) и нескольких типов связей . Эти сущности могут быть весьма разнообразными. Примерами являются люди, организации, темы, ресурсы, задачи, события, местоположения и убеждения.
Методы динамических сетей особенно полезны для оценки тенденций и изменений в сетях с течением времени, выявления новых лидеров и изучения совместной эволюции людей и идей.
С недавним взрывом общедоступных биологических данных высокой пропускной способности анализ молекулярных сетей приобрел значительный интерес. Тип анализа в этом контенте тесно связан с анализом социальных сетей, но часто фокусируется на локальных закономерностях в сети. Например, сетевые мотивы — это небольшие подграфы, которые перепредставлены в сети. Мотивы активности — это аналогичные перепредставленные закономерности в атрибутах узлов и ребер в сети, которые перепредставлены с учетом структуры сети. Анализ биологических сетей привел к развитию сетевой медицины , которая рассматривает влияние заболеваний в интерактоме . [40]
Анализ семантических сетей — это подраздел сетевого анализа, который фокусируется на отношениях между словами и концепциями в сети. Слова представлены в виде узлов, а их близость или совместное появление в тексте представлены в виде ребер. Таким образом, семантические сети являются графическими представлениями знаний и обычно используются в нейролингвистике и приложениях обработки естественного языка . Анализ семантических сетей также используется как метод анализа больших текстов и определения основных тем и разделов (например, сообщений в социальных сетях ), для выявления предубеждений (например, в новостном освещении) или даже для картирования целой области исследований. [41]
Анализ связей — это подмножество сетевого анализа, исследующее связи между объектами. Примером может служить изучение адресов подозреваемых и жертв, телефонных номеров, которые они набирали, и финансовых транзакций, в которых они участвовали в течение определенного периода времени, а также семейных отношений между этими субъектами в рамках полицейского расследования. Анализ связей здесь обеспечивает важные связи и ассоциации между очень многими объектами разных типов, которые не очевидны из изолированных фрагментов информации. Компьютерный или полностью автоматический компьютерный анализ связей все чаще используется банками и страховыми агентствами для обнаружения мошенничества , операторами связи для анализа телекоммуникационных сетей, медицинским сектором в эпидемиологии и фармакологии , в расследованиях правоохранительных органов , поисковыми системами для оценки релевантности (и наоборот, спамерами для спамдексинга и владельцами бизнеса для поисковой оптимизации ), и везде, где необходимо анализировать связи между многими объектами.
Модель SIR является одним из наиболее известных алгоритмов прогнозирования распространения глобальных пандемий среди инфицированной популяции.
Приведенная выше формула описывает «силу» заражения для каждой восприимчивой единицы в инфекционной популяции, где β эквивалентна скорости передачи данного заболевания.
Чтобы отслеживать изменение восприимчивости среди инфицированной популяции:
Со временем число инфицированных колеблется в зависимости от: установленной скорости выздоровления, представленной как , но вычтенной из среднего инфекционного периода до единицы , количества инфицированных лиц, , и изменения во времени, .
С точки зрения модели SIR, охватит ли население пандемией или нет, зависит от значения «среднего числа людей, инфицированных одним инфицированным лицом».
Несколько алгоритмов ранжирования веб-поиска используют метрики центральности на основе ссылок, включая (в порядке появления) Hyper Search Марчиори , PageRank Google , алгоритм HITS Клейнберга , алгоритмы CheiRank и TrustRank . Анализ ссылок также проводится в информатике и коммуникационной науке для понимания и извлечения информации из структуры коллекций веб-страниц. Например, анализ может быть связан с взаимосвязями между веб -сайтами или блогами политиков.
PageRank работает, случайным образом выбирая «узлы» или веб-сайты, а затем с определенной вероятностью «случайно перескакивая» на другие узлы. Случайно перескакивая на эти другие узлы, он помогает PageRank полностью обойти сеть, поскольку некоторые веб-страницы находятся на периферии и не будут так легко оценены.
Каждый узел имеет PageRank, определяемый как сумма страниц , ссылающихся на , умноженная на единицу, деленная на исходящие ссылки или «степень исхода», умноженную на «важность» или PageRank .
Как объяснялось выше, PageRank использует случайные переходы в попытках присвоить PageRank каждому веб-сайту в Интернете. Эти случайные переходы находят веб-сайты, которые не могут быть найдены при обычных методологиях поиска, таких как поиск в ширину и поиск в глубину .
В улучшении вышеупомянутой формулы для определения PageRank есть добавление этих случайных компонентов прыжка. Без случайных прыжков некоторые страницы получили бы PageRank 0, что было бы нехорошо.
Первая — это , или вероятность того, что произойдет случайный скачок. Противоположность — это «коэффициент затухания», или .
Другой способ взглянуть на это:
Информация об относительной важности узлов и ребер в графе может быть получена с помощью мер центральности , широко используемых в таких дисциплинах, как социология . Меры центральности необходимы, когда сетевой анализ должен ответить на такие вопросы, как: «Какие узлы в сети должны быть нацелены, чтобы гарантировать, что сообщение или информация будут распространены на все или большинство узлов в сети?» или наоборот, «Какие узлы должны быть нацелены, чтобы ограничить распространение заболевания?». Официально установленными мерами центральности являются степень центральности , близость центральности , промежуточность центральности , собственный вектор центральности и катц центральности . Цель сетевого анализа обычно определяет тип меры центральности, которая будет использоваться. [32]
Контент в сложной сети может распространяться двумя основными способами: сохраняющимся и не сохраняющимся. [42] При сохраняющемся распространении общий объем контента, который поступает в сложную сеть, остается постоянным по мере прохождения через нее. Модель сохраняющегося распространения лучше всего можно представить в виде кувшина, содержащего фиксированное количество воды, наливаемой в ряд воронок, соединенных трубками. Здесь кувшин представляет собой исходный источник, а вода — распространяемое содержимое. Воронки и соединительные трубки представляют собой узлы и связи между узлами соответственно. Когда вода переходит из одной воронки в другую, вода мгновенно исчезает из воронки, которая ранее подвергалась воздействию воды. При не сохраняющемся распространении объем контента изменяется по мере того, как он поступает и проходит через сложную сеть. Модель не сохраняющегося распространения лучше всего можно представить в виде непрерывно работающего крана, проходящего через ряд воронок, соединенных трубками. Здесь объем воды из исходного источника бесконечен. Кроме того, любые воронки, которые были подвержены воздействию воды, продолжают испытывать воздействие воды, даже когда она проходит в последующие воронки. Неконсервативная модель является наиболее подходящей для объяснения передачи большинства инфекционных заболеваний .
В 1927 году WO Kermack и AG McKendrick создали модель, в которой они рассматривали фиксированную популяцию только с тремя отсеками: восприимчивыми: , инфицированными, , и выздоровевшими, . Отсеки, используемые для этой модели, состоят из трех классов:
Поток этой модели можно рассматривать следующим образом:
Используя фиксированную популяцию , Кермак и Маккендрик вывели следующие уравнения:
При формулировке этих уравнений было сделано несколько предположений: во-первых, индивидуум в популяции должен рассматриваться как имеющий равную вероятность заражения болезнью, как и любой другой индивидуум, со скоростью , которая считается скоростью контакта или заражения болезнью. Таким образом, инфицированный индивидуум вступает в контакт и может передать болезнь другим в единицу времени, а доля контактов инфицированного с восприимчивым составляет . Число новых случаев заражения в единицу времени на одного инфицированного тогда составляет , что дает скорость новых случаев заражения (или тех, кто покидает восприимчивую категорию) как (Brauer & Castillo-Chavez, 2001). Для второго и третьего уравнений считайте, что популяция, покидающая восприимчивый класс, равна числу, входящему в инфицированный класс. Однако инфицированные покидают этот класс в единицу времени, чтобы войти в выздоровевший/удаленный класс со скоростью в единицу времени (где представляет собой среднюю скорость выздоровления или средний инфекционный период). Эти процессы, которые происходят одновременно, называются Законом Массового Действия , широко распространенной идеей, что скорость контакта между двумя группами в популяции пропорциональна размеру каждой из затронутых групп (Daley & Gani, 2005). Наконец, предполагается, что скорость заражения и выздоровления намного быстрее, чем временная шкала рождений и смертей, и поэтому эти факторы игнорируются в этой модели.
Более подробную информацию об этой модели можно прочитать на странице «Модель эпидемии» .
Основное уравнение может выражать поведение ненаправленной растущей сети, где на каждом временном шаге к сети добавляется новый узел, связанный со старым узлом (выбранным случайно и без предпочтений). Первоначальная сеть образована двумя узлами и двумя связями между ними в момент времени , эта конфигурация необходима только для упрощения дальнейших вычислений, поэтому в момент времени сеть имеет узлы и связи.
Основное уравнение для этой сети:
где — вероятность иметь узел со степенью в момент времени , а — временной шаг, когда этот узел был добавлен в сеть. Обратите внимание, что есть только два способа для старого узла иметь связи в момент времени :
После упрощения этой модели распределение степеней равно [43]
На основе этой растущей сети разрабатывается эпидемическая модель, которая следует простому правилу: каждый раз, когда добавляется новый узел и после выбора старого узла для связи, принимается решение: будет ли этот новый узел инфицирован или нет. Основное уравнение для этой эпидемической модели:
где представляет собой решение заражать ( ) или нет ( ). Решая это основное уравнение, получаем следующее решение: [44]
Многослойные сети — это сети с множественными видами связей. [45] Попытки моделировать системы реального мира в виде многомерных сетей использовались в различных областях, таких как анализ социальных сетей, [46] экономика, история, городской и международный транспорт, экология, психология, медицина, биология, коммерция, климатология, физика, вычислительная нейронаука, управление операциями и финансы.
Сетевые проблемы, которые включают поиск оптимального способа сделать что-либо, изучаются под названием комбинаторной оптимизации . Примерами являются сетевой поток , задача кратчайшего пути , транспортная задача , задача перевалки , задача местоположения , задача соответствия , задача назначения , задача упаковки , задача маршрутизации , анализ критического пути и PERT (метод оценки и обзора программ).
Взаимозависимые сети — это сети, в которых функционирование узлов одной сети зависит от функционирования узлов другой сети. В природе сети редко появляются изолированно, скорее, сети обычно являются элементами более крупных систем и взаимодействуют с элементами в этой сложной системе. Такие сложные зависимости могут оказывать нетривиальное влияние друг на друга. Хорошо изученным примером является взаимозависимость инфраструктурных сетей, [47] электростанции, которые образуют узлы энергосистемы, требуют топлива, поставляемого по сети дорог или труб, и также контролируются через узлы коммуникационной сети. Хотя транспортная сеть не зависит от функционирования энергосистемы, коммуникационная сеть зависит. В таких инфраструктурных сетях нарушение функционирования критического числа узлов либо в энергосистеме, либо в коммуникационной сети может привести к каскадным отказам по всей системе с потенциально катастрофическим результатом для функционирования всей системы. [48] Если бы две сети рассматривались изолированно, этот важный эффект обратной связи не был бы замечен, и прогнозы надежности сети были бы сильно переоценены.