stringtranslate.com

Сетевая наука

Сетевая наука — это академическая область, которая изучает сложные сети , такие как телекоммуникационные сети , компьютерные сети , биологические сети , когнитивные и семантические сети и социальные сети , рассматривая отдельные элементы или субъектов, представленных узлами (или вершинами ), и связи между элементами или субъектами как ссылки (или ребра ). Область опирается на теории и методы, включая теорию графов из математики, статистическую механику из физики, интеллектуальный анализ данных и визуализацию информации из компьютерной науки, инференциальное моделирование из статистики и социальную структуру из социологии. Национальный исследовательский совет США определяет сетевую науку как «изучение сетевых представлений физических, биологических и социальных явлений, приводящее к предиктивным моделям этих явлений». [1]

Предыстория и история

Изучение сетей возникло в различных дисциплинах как средство анализа сложных реляционных данных. Самая ранняя известная работа в этой области — знаменитая работа « Семь мостов Кёнигсберга», написанная Леонардом Эйлером в 1736 году. Математическое описание вершин и ребер Эйлером стало основой теории графов , раздела математики, изучающего свойства парных отношений в сетевой структуре. Область теории графов продолжала развиваться и нашла применение в химии (Сильвестр, 1878).

Денеш Кёниг , венгерский математик и профессор, написал первую книгу по теории графов под названием «Теория конечных и бесконечных графов» в 1936 году. [2]

Социограмма Морено для 1-го класса.

В 1930-х годах в США прибыл Джейкоб Морено , психолог в традиции гештальт-психологии . Он разработал социограмму и представил ее публике в апреле 1933 года на съезде ученых-медиков. Морено утверждал, что «до появления социометрии никто не знал, как именно выглядит межличностная структура группы». [3] Социограмма представляла собой представление социальной структуры группы учеников начальной школы. Мальчики дружили с мальчиками, а девочки дружили с девочками, за исключением одного мальчика, который сказал, что ему нравится одна девочка. Чувство не было взаимным. Это сетевое представление социальной структуры было найдено настолько интригующим, что его напечатали в The New York Times . [4] Социограмма нашла множество применений и переросла в область анализа социальных сетей .

Вероятностная теория в сетевой науке развивалась как ответвление теории графов с восемью известными статьями Пола Эрдёша и Альфреда Реньи о случайных графах . Для социальных сетей экспоненциальная модель случайного графа или p* является нотационной структурой, используемой для представления вероятностного пространства связи, происходящей в социальной сети . Альтернативным подходом к структурам вероятности сети является матрица вероятности сети , которая моделирует вероятность появления ребер в сети на основе исторического наличия или отсутствия ребра в выборке сетей.

Интерес к сетям резко возрос около 2000 года после новых открытий, которые предложили новую математическую основу для описания различных топологий сетей, что привело к появлению термина «сетевая наука». Альберт-Ласло Барабаши и Река Альберт открыли природу безмасштабных сетей [5] многих реальных сетей, от WWW до ячейки. Свойство безмасштабности отражает тот факт, что в реальных сетевых концентраторах сосуществуют многие вершины малой степени, и авторы предложили динамическую модель для объяснения происхождения этого безмасштабного состояния [5] . Дункан Уоттс и Стивен Строгац согласовали эмпирические данные о сетях с математическим представлением, описав сеть малого мира . [6]

Классификация сети

Детерминированная сеть

Определение детерминированной сети определяется по сравнению с определением вероятностной сети. В невзвешенных детерминированных сетях ребра либо существуют, либо нет, обычно мы используем 0 для представления отсутствия ребра, а 1 для представления наличия ребра. В взвешенных детерминированных сетях значение ребра представляет вес каждого ребра, например, уровень прочности.

Вероятностная сеть

В вероятностных сетях значения за каждым ребром представляют вероятность существования каждого ребра. Например, если одно ребро имеет значение, равное 0,9, мы говорим, что вероятность существования этого ребра равна 0,9. [7]

Сетевые свойства

Часто сети имеют определенные атрибуты, которые можно вычислить для анализа свойств и характеристик сети. Поведение этих сетевых свойств часто определяет сетевые модели и может использоваться для анализа того, как определенные модели контрастируют друг с другом. Многие определения других терминов, используемых в сетевой науке, можно найти в Глоссарии теории графов .

Размер

Размер сети может относиться к числу узлов или, реже, к числу ребер , которое (для связных графов без множественных ребер) может варьироваться от (дерево) до (полный граф). В случае простого графа (сети, в которой между каждой парой вершин существует не более одного (неориентированного) ребра, и в которой ни одна вершина не соединяется сама с собой), мы имеем ; для направленных графов (без самосвязанных узлов), ; для направленных графов с разрешенными самосвязями, . В случае графа, в котором между парой вершин могут существовать множественные ребра, .

Плотность

Плотность сети определяется как нормализованное отношение между 0 и 1 числа ребер к числу возможных ребер в сети с узлами. Плотность сети является мерой процента «необязательных» ребер, которые существуют в сети, и может быть вычислена как где и являются минимальным и максимальным числом ребер в связанной сети с узлами соответственно. В случае простых графов задается биномиальным коэффициентом и , что дает плотность . Другое возможное уравнение — тогда как связи являются однонаправленными (Wasserman & Faust 1994). [8] Это дает лучший обзор плотности сети, поскольку однонаправленные отношения могут быть измерены.

Плотность планарной сети

Плотность сети, в которой нет пересечений между ребрами, определяется как отношение числа ребер к числу возможных ребер в сети с узлами, заданной графом без пересекающихся ребер , что дает

Средняя степень

Степень узла — это количество ребер, соединенных с ним. Тесно связана с плотностью сети средняя степень ( или, в случае ориентированных графов, бывший множитель 2, возникающий из каждого ребра в неориентированном графе, способствующий степени двух различных вершин). В модели случайного графа ER ( ) мы можем вычислить ожидаемое значение (равное ожидаемому значению произвольной вершины): случайная вершина имеет другие доступные вершины в сети и с вероятностью соединяется с каждой из них. Таким образом, .

Средняя длина кратчайшего пути (или характерная длина пути)

Средняя длина кратчайшего пути вычисляется путем нахождения кратчайшего пути между всеми парами узлов и взятия среднего значения по всем путям его длины (длина представляет собой количество промежуточных ребер, содержащихся в пути, т. е. расстояние между двумя вершинами в графе). Это показывает нам, в среднем, количество шагов, которое требуется, чтобы добраться от одного члена сети до другого. Поведение ожидаемой средней длины кратчайшего пути (то есть среднего ансамбля средней длины кратчайшего пути) как функции количества вершин случайной сетевой модели определяет, демонстрирует ли эта модель эффект маленького мира; если она масштабируется как , модель генерирует сети маленького мира. При росте быстрее логарифмического модель не создает маленьких миров. Особый случай известен как эффект сверхмалого мира.

Диаметр сети

В качестве другого средства измерения сетевых графиков мы можем определить диаметр сети как самый длинный из всех вычисленных кратчайших путей в сети. Это самое короткое расстояние между двумя самыми удаленными узлами в сети. Другими словами, как только вычислена длина кратчайшего пути от каждого узла до всех других узлов, диаметр становится самым длинным из всех вычисленных длин путей. Диаметр представляет линейный размер сети. Если соединены узлы ABCD, то, идя от A->D, это будет диаметр 3 (3 перехода, 3 связи). [ необходима цитата ]

Коэффициент кластеризации

Коэффициент кластеризации является мерой свойства «все мои друзья знают друг друга». Иногда это описывается как друзья моих друзей — мои друзья. Точнее, коэффициент кластеризации узла — это отношение существующих связей, соединяющих соседей узла друг с другом, к максимально возможному числу таких связей. Коэффициент кластеризации для всей сети — это среднее значение коэффициентов кластеризации всех узлов. Высокий коэффициент кластеризации для сети — еще один признак того, что мир тесен .

Коэффициент кластеризации '-го узла равен

где - число соседей 'th узла, а - число соединений между этими соседями. Максимально возможное число соединений между соседями равно, тогда,

С вероятностной точки зрения ожидаемый локальный коэффициент кластеризации представляет собой вероятность существования связи между двумя произвольными соседями одного и того же узла.

Связанность

Способ, которым соединена сеть, играет большую роль в том, как сети анализируются и интерпретируются. Сети классифицируются по четырем различным категориям:

Центральность узла

Индексы центральности создают рейтинги, которые стремятся определить самые важные узлы в сетевой модели. Различные индексы центральности кодируют различные контексты для слова «важность». Например, центральность по промежуточности считает узел очень важным, если он образует мосты между многими другими узлами. Центральность по собственному значению , напротив, считает узел очень важным, если с ним связаны многие другие очень важные узлы. Сотни таких мер были предложены в литературе.

Индексы центральности точны только для определения наиболее важных узлов. Меры редко, если вообще когда-либо, имеют смысл для остальных узлов сети. [9] [10] Кроме того, их показания точны только в рамках их предполагаемого контекста важности и имеют тенденцию «неправильно понимать» для других контекстов. [11] Например, представьте себе два отдельных сообщества, единственной связью которых является ребро между самым младшим членом каждого сообщества. Поскольку любой переход из одного сообщества в другое должен проходить по этой связи, два младших члена будут иметь высокую центральность по промежуточности. Но, поскольку они младшие, (предположительно) у них мало связей с «важными» узлами в их сообществе, что означает, что их центральность по собственному значению будет довольно низкой.

Влияние узла

Ограничения мер центральности привели к разработке более общих мер. Двумя примерами являются доступность , которая использует разнообразие случайных блужданий для измерения того, насколько доступна остальная часть сети из заданного начального узла, [12] и ожидаемая сила , полученная из ожидаемого значения силы заражения, генерируемого узлом. [9] Обе эти меры могут быть осмысленно вычислены только из структуры сети.

Структура сообщества

Рис. 1: Эскиз небольшой сети , отображающей структуру сообщества , с тремя группами узлов с плотными внутренними связями и более редкими связями между группами.

Узлы в сети могут быть разделены на группы, представляющие сообщества. В зависимости от контекста сообщества могут быть отдельными или перекрывающимися. Как правило, узлы в таких сообществах будут сильно связаны с другими узлами в том же сообществе, но слабо связаны с узлами вне сообщества. В отсутствие истинного описания структуры сообщества конкретной сети было разработано несколько алгоритмов для вывода возможных структур сообществ с использованием контролируемых или неконтролируемых методов кластеризации.

Сетевые модели

Сетевые модели служат основой для понимания взаимодействий в эмпирических сложных сетях. Различные модели генерации случайных графов создают сетевые структуры, которые можно использовать в сравнении с реальными сложными сетями.

Модель случайного графа Эрдеша – Реньи

Эта модель Эрдёша–Реньи генерируется с N = 4 узлами. Для каждого ребра в полном графе, образованном всеми N узлами, генерируется случайное число и сравнивается с заданной вероятностью. Если случайное число меньше p , в модели формируется ребро.

Модель Эрдёша–Реньи , названная в честь Пола Эрдёша и Альфреда Реньи , используется для генерации случайных графов , в которых ребра устанавливаются между узлами с равными вероятностями. Она может использоваться в вероятностном методе для доказательства существования графов, удовлетворяющих различным свойствам, или для предоставления строгого определения того, что означает, что свойство выполняется почти для всех графов.

Для создания модели Эрдёша–Реньи необходимо указать два параметра: общее количество узлов n и вероятность p того, что случайная пара узлов имеет ребро.

Поскольку модель создается без смещения относительно конкретных узлов, распределение степеней является биномиальным: для случайно выбранной вершины ,

В этой модели коэффициент кластеризации равен 0 a.s. Поведение можно разбить на три области.

Докритический : Все компоненты простые и очень маленькие, самый большой компонент имеет размер ;

Критический : ;

Сверхкритический : где — положительное решение уравнения .

Самый большой связный компонент имеет высокую сложность. Все остальные компоненты простые и маленькие .

Модель конфигурации

Модель конфигурации принимает последовательность степеней [13] [14] или распределение степеней [15] (которое впоследствии используется для генерации последовательности степеней) в качестве входных данных и производит случайно связанные графы во всех отношениях, кроме последовательности степеней. Это означает, что для заданного выбора последовательности степеней граф выбирается равномерно случайным образом из набора всех графов, которые соответствуют этой последовательности степеней. Степень случайно выбранной вершины является независимой и одинаково распределенной случайной величиной с целочисленными значениями. Когда , граф конфигурации содержит гигантский связный компонент , который имеет бесконечный размер. [14] Остальные компоненты имеют конечные размеры, которые можно количественно определить с помощью понятия распределения размеров. Вероятность того, что случайно выбранный узел соединен с компонентом размера, задается степенями свертки распределения степеней: [16] где обозначает распределение степеней и . Гигантский компонент может быть уничтожен путем случайного удаления критической доли всех ребер. Этот процесс называется перколяцией в случайных сетях . Когда второй момент распределения степеней конечен, , эта критическая доля ребер определяется как [17] , а среднее расстояние между вершинами в гигантском компоненте масштабируется логарифмически с общим размером сети, . [15]

В модели направленной конфигурации степень узла задается двумя числами, входящей и исходящей степенью , и, следовательно, распределение степеней является двумерным. Ожидаемое число входящих и исходящих ребер совпадает, так что . Модель направленной конфигурации содержит гигантский компонент тогда и только тогда, когда [18] Обратите внимание, что и равны и, следовательно, взаимозаменяемы в последнем неравенстве. Вероятность того, что случайно выбранная вершина принадлежит компоненту размера, задается как: [19] для входящих компонентов, и

для внешних компонентов.

Модель маленького мира Уоттса–Строгаца

Модель Уоттса и Строгаца использует концепцию перемонтажа для достижения своей структуры. Генератор модели будет итерировать по каждому ребру в исходной решетчатой ​​структуре. Ребро может менять свои соединенные вершины в соответствии с заданной вероятностью перемонтажа. в этом примере.

Модель Уоттса и Строгаца — это модель случайной генерации графов, которая создает графы со свойствами тесного мира .

Для генерации модели Уоттса–Строгаца используется начальная решетчатая структура. Каждый узел в сети изначально связан со своими ближайшими соседями. Другой параметр указывается как вероятность переподключения. Каждое ребро имеет вероятность того, что оно будет переподключено к графу как случайное ребро. Ожидаемое количество переподключенных связей в модели равно .

Поскольку модель Уоттса–Строгаца начинается как неслучайная решетчатая структура, она имеет очень высокий коэффициент кластеризации наряду с высокой средней длиной пути. Каждая перевязка, вероятно, создаст сокращение между сильно связанными кластерами. По мере увеличения вероятности перевязки коэффициент кластеризации уменьшается медленнее, чем средняя длина пути. По сути, это позволяет средней длине пути сети значительно уменьшиться при лишь небольшом уменьшении коэффициента кластеризации. Более высокие значения p вызывают больше перевязанных ребер, что по сути делает модель Уоттса–Строгаца случайной сетью.

Модель предпочтительной привязанности Барабаши – Альберта (BA)

Модель Барабаши–Альберта — это случайная сетевая модель, используемая для демонстрации предпочтительного присоединения или эффекта «богатый становится богаче». В этой модели ребро, скорее всего, прикрепится к узлам с более высокими степенями. Сеть начинается с начальной сети из m 0 узлов. m 0  ≥ 2, а степень каждого узла в начальной сети должна быть не менее 1, в противном случае он всегда будет оставаться отсоединенным от остальной части сети.

В модели BA новые узлы добавляются в сеть по одному за раз. Каждый новый узел подключается к существующим узлам с вероятностью, пропорциональной количеству связей, которые уже есть у существующих узлов. Формально вероятность p i того, что новый узел подключен к узлу i, равна [20]

где k i — степень узла i . Сильно связанные узлы («хабы») имеют тенденцию быстро накапливать еще больше связей, в то время как узлы с небольшим количеством связей вряд ли будут выбраны в качестве места назначения для новой связи. Новые узлы имеют «предпочтение» присоединяться к уже сильно связанным узлам.

Распределение степеней модели BA, которое следует степенному закону. В двойном логарифмическом масштабе степенная функция представляет собой прямую линию. [21]

Распределение степеней, полученное в результате использования модели BA, не зависит от масштаба, в частности, для больших степеней оно представляет собой степенной закон вида:

Хабы демонстрируют высокую центральность промежуточности, что позволяет коротким путям существовать между узлами. В результате модель BA имеет тенденцию иметь очень короткие средние длины путей. Коэффициент кластеризации этой модели также стремится к 0.

Модель Барабаши–Альберта [21] была разработана для ненаправленных сетей с целью объяснить универсальность свойства безмасштабности и применена к широкому спектру различных сетей и приложений. Направленная версия этой модели — модель Прайса [22] [23] , которая была разработана только для сетей цитирования.

Нелинейное преимущественное присоединение

В нелинейном предпочтительном присоединении (NLPA) существующие узлы в сети получают новые ребра пропорционально степени узла, возведенной в постоянную положительную степень, . [24] Формально это означает, что вероятность того, что узел получит новое ребро, определяется как

Если , NLPA сводится к модели BA и называется «линейным». Если , NLPA называется «сублинейным», а распределение степеней сети стремится к растянутому экспоненциальному распределению . Если , NLPA называется «суперлинейным», а небольшое количество узлов соединяется почти со всеми другими узлами в сети. Для обоих и свойство масштабируемости сети нарушается в пределе бесконечного размера системы. Однако, если лишь немного больше , NLPA может привести к распределениям степеней , которые кажутся временно масштабируемыми. [25]

Модель привязанности, основанной на посредничестве (MDA)

В модели присоединения с посредничеством (MDA) , в которой новый узел, приходящий с ребрами, выбирает существующий связанный узел случайным образом, а затем соединяется не с ним, а с его соседями, выбранными также случайным образом. Вероятность того, что узел существующего выбранного узла

Фактор является обратной величиной гармонического среднего (IHM) степеней соседей узла . Обширные численные исследования показывают, что для приблизительно среднее значение IHM в большом пределе становится константой, что означает . Это подразумевает, что чем выше связи (степень) у узла, тем выше его шанс получить больше связей, поскольку они могут быть достигнуты большим количеством способов через посредников, что по сути воплощает интуитивную идею механизма «богатый становится богаче» (или правило предпочтительного присоединения модели Барабаши–Альберта). Таким образом, можно увидеть, что сеть MDA следует правилу PA, но замаскированно. [26]

Однако, поскольку он описывает механизм «победитель получает все», мы обнаруживаем, что почти все узлы имеют степень один, а один является сверхбогатым по степени. По мере увеличения значения неравенство между сверхбогатыми и бедными уменьшается, и мы обнаруживаем переход от механизма «богатые становятся сверхбогатыми» к механизму «богатые становятся еще богаче».

Фитнес-модель

Другая модель, где ключевым компонентом является природа вершины, была введена Калдарелли и др. [27] Здесь связь создается между двумя вершинами с вероятностью, заданной связывающей функцией пригодности вовлеченных вершин. Степень вершины i задается как [28]

Если — обратимая и возрастающая функция , то распределение вероятностей определяется выражением

В результате, если приспособленности распределены по степенному закону, то и степень узла распределена по степенному закону.

Менее интуитивно с быстро убывающим распределением вероятностей, как вместе с функцией связывания вида

с константой и функцией Хэвисайда мы также получаем безмасштабные сети.

Такая модель успешно применялась для описания торговли между странами, используя ВВП как соответствие различным узлам и связующую функцию такого рода [29] [30]

Модели случайных экспоненциальных графов

Экспоненциальные случайные графовые модели (ERGM) — это семейство статистических моделей для анализа данных из социальных и других сетей. [31] Экспоненциальное семейство — это широкое семейство моделей, охватывающее многие типы данных, а не только сети. ERGM — это модель из этого семейства, которая описывает сети.

Мы принимаем обозначение для представления случайного графа с помощью набора узлов и коллекции связующих переменных , индексированных парами узлов , где , если узлы соединены ребром, и , в противном случае.

Основное предположение ERGM заключается в том, что структура в наблюдаемом графе может быть объяснена заданным вектором достаточной статистики , которая является функцией наблюдаемой сети и, в некоторых случаях, узловых атрибутов. Вероятность графа в ERGM определяется как:

где — вектор параметров модели, связанный с , а — нормирующая константа.

Сетевой анализ

Анализ социальных сетей

Анализ социальных сетей изучает структуру отношений между социальными сущностями. [32] Эти сущности часто являются людьми, но также могут быть группами , организациями , национальными государствами , веб-сайтами , научными публикациями .

С 1970-х годов эмпирическое изучение сетей играет центральную роль в социальных науках, и многие из математических и статистических инструментов, используемых для изучения сетей, были впервые разработаны в социологии . [33] Среди многих других приложений анализ социальных сетей использовался для понимания распространения новостей и слухов. Аналогичным образом, он использовался для изучения распространения как болезней , так и поведения, связанного со здоровьем . Он также применялся к изучению рынков , где он использовался для изучения роли доверия в отношениях обмена и социальных механизмов в установлении цен. Аналогичным образом, он использовался для изучения вербовки в политические движения и общественные организации. Он также использовался для концептуализации научных разногласий, а также академического престижа. Совсем недавно сетевой анализ (и его близкий родственник анализ трафика ) получил значительное применение в военной разведке для раскрытия повстанческих сетей как иерархического, так и беслидерного характера. [34] [35] В криминологии он используется для выявления влиятельных участников преступных группировок, преступных движений, соучастников преступлений, прогнозирования преступной деятельности и разработки политики. [36]

Динамический сетевой анализ

Динамический сетевой анализ изучает изменяющуюся структуру взаимоотношений между различными классами сущностей в сложных социально-технических системах и отражает социальную стабильность и изменения, такие как появление новых групп, тем и лидеров. [37] [38] [39] Динамический сетевой анализ фокусируется на метасетях, состоящих из нескольких типов узлов (сущностей) и нескольких типов связей . Эти сущности могут быть весьма разнообразными. Примерами являются люди, организации, темы, ресурсы, задачи, события, местоположения и убеждения.

Методы динамических сетей особенно полезны для оценки тенденций и изменений в сетях с течением времени, выявления новых лидеров и изучения совместной эволюции людей и идей.

Анализ биологических сетей

С недавним взрывом общедоступных биологических данных высокой пропускной способности анализ молекулярных сетей приобрел значительный интерес. Тип анализа в этом контенте тесно связан с анализом социальных сетей, но часто фокусируется на локальных закономерностях в сети. Например, сетевые мотивы — это небольшие подграфы, которые перепредставлены в сети. Мотивы активности — это аналогичные перепредставленные закономерности в атрибутах узлов и ребер в сети, которые перепредставлены с учетом структуры сети. Анализ биологических сетей привел к развитию сетевой медицины , которая рассматривает влияние заболеваний в интерактоме . [40]

Семантический сетевой анализ

Анализ семантических сетей — это подраздел сетевого анализа, который фокусируется на отношениях между словами и концепциями в сети. Слова представлены в виде узлов, а их близость или совместное появление в тексте представлены в виде ребер. Таким образом, семантические сети являются графическими представлениями знаний и обычно используются в нейролингвистике и приложениях обработки естественного языка . Анализ семантических сетей также используется как метод анализа больших текстов и определения основных тем и разделов (например, сообщений в социальных сетях ), для выявления предубеждений (например, в новостном освещении) или даже для картирования целой области исследований. [41]

Анализ ссылок

Анализ связей — это подмножество сетевого анализа, исследующее связи между объектами. Примером может служить изучение адресов подозреваемых и жертв, телефонных номеров, которые они набирали, и финансовых транзакций, в которых они участвовали в течение определенного периода времени, а также семейных отношений между этими субъектами в рамках полицейского расследования. Анализ связей здесь обеспечивает важные связи и ассоциации между очень многими объектами разных типов, которые не очевидны из изолированных фрагментов информации. Компьютерный или полностью автоматический компьютерный анализ связей все чаще используется банками и страховыми агентствами для обнаружения мошенничества , операторами связи для анализа телекоммуникационных сетей, медицинским сектором в эпидемиологии и фармакологии , в расследованиях правоохранительных органов , поисковыми системами для оценки релевантности (и наоборот, спамерами для спамдексинга и владельцами бизнеса для поисковой оптимизации ), и везде, где необходимо анализировать связи между многими объектами.

Анализ пандемии

Модель SIR является одним из наиболее известных алгоритмов прогнозирования распространения глобальных пандемий среди инфицированной популяции.

Восприимчив к инфицированию

Приведенная выше формула описывает «силу» заражения для каждой восприимчивой единицы в инфекционной популяции, где β эквивалентна скорости передачи данного заболевания.

Чтобы отслеживать изменение восприимчивости среди инфицированной популяции:

Инфицированные и выздоровевшие

Со временем число инфицированных колеблется в зависимости от: установленной скорости выздоровления, представленной как , но вычтенной из среднего инфекционного периода до единицы , количества инфицированных лиц, , и изменения во времени, .

Инфекционный период

С точки зрения модели SIR, охватит ли население пандемией или нет, зависит от значения «среднего числа людей, инфицированных одним инфицированным лицом».

Анализ веб-ссылок

Несколько алгоритмов ранжирования веб-поиска используют метрики центральности на основе ссылок, включая (в порядке появления) Hyper Search Марчиори , PageRank Google , алгоритм HITS Клейнберга , алгоритмы CheiRank и TrustRank . Анализ ссылок также проводится в информатике и коммуникационной науке для понимания и извлечения информации из структуры коллекций веб-страниц. Например, анализ может быть связан с взаимосвязями между веб -сайтами или блогами политиков.

PageRank

PageRank работает, случайным образом выбирая «узлы» или веб-сайты, а затем с определенной вероятностью «случайно перескакивая» на другие узлы. Случайно перескакивая на эти другие узлы, он помогает PageRank полностью обойти сеть, поскольку некоторые веб-страницы находятся на периферии и не будут так легко оценены.

Каждый узел имеет PageRank, определяемый как сумма страниц , ссылающихся на , умноженная на единицу, деленная на исходящие ссылки или «степень исхода», умноженную на «важность» или PageRank .

Случайные прыжки

Как объяснялось выше, PageRank использует случайные переходы в попытках присвоить PageRank каждому веб-сайту в Интернете. Эти случайные переходы находят веб-сайты, которые не могут быть найдены при обычных методологиях поиска, таких как поиск в ширину и поиск в глубину .

В улучшении вышеупомянутой формулы для определения PageRank есть добавление этих случайных компонентов прыжка. Без случайных прыжков некоторые страницы получили бы PageRank 0, что было бы нехорошо.

Первая — это , или вероятность того, что произойдет случайный скачок. Противоположность — это «коэффициент затухания», или .

Другой способ взглянуть на это:

Меры центральности

Информация об относительной важности узлов и ребер в графе может быть получена с помощью мер центральности , широко используемых в таких дисциплинах, как социология . Меры центральности необходимы, когда сетевой анализ должен ответить на такие вопросы, как: «Какие узлы в сети должны быть нацелены, чтобы гарантировать, что сообщение или информация будут распространены на все или большинство узлов в сети?» или наоборот, «Какие узлы должны быть нацелены, чтобы ограничить распространение заболевания?». Официально установленными мерами центральности являются степень центральности , близость центральности , промежуточность центральности , собственный вектор центральности и катц центральности . Цель сетевого анализа обычно определяет тип меры центральности, которая будет использоваться. [32]

Распространение контента в сетях

Контент в сложной сети может распространяться двумя основными способами: сохраняющимся и не сохраняющимся. [42] При сохраняющемся распространении общий объем контента, который поступает в сложную сеть, остается постоянным по мере прохождения через нее. Модель сохраняющегося распространения лучше всего можно представить в виде кувшина, содержащего фиксированное количество воды, наливаемой в ряд воронок, соединенных трубками. Здесь кувшин представляет собой исходный источник, а вода — распространяемое содержимое. Воронки и соединительные трубки представляют собой узлы и связи между узлами соответственно. Когда вода переходит из одной воронки в другую, вода мгновенно исчезает из воронки, которая ранее подвергалась воздействию воды. При не сохраняющемся распространении объем контента изменяется по мере того, как он поступает и проходит через сложную сеть. Модель не сохраняющегося распространения лучше всего можно представить в виде непрерывно работающего крана, проходящего через ряд воронок, соединенных трубками. Здесь объем воды из исходного источника бесконечен. Кроме того, любые воронки, которые были подвержены воздействию воды, продолжают испытывать воздействие воды, даже когда она проходит в последующие воронки. Неконсервативная модель является наиболее подходящей для объяснения передачи большинства инфекционных заболеваний .

Модель SIR

В 1927 году WO Kermack и AG McKendrick создали модель, в которой они рассматривали фиксированную популяцию только с тремя отсеками: восприимчивыми: , инфицированными, , и выздоровевшими, . Отсеки, используемые для этой модели, состоят из трех классов:

Поток этой модели можно рассматривать следующим образом:

Используя фиксированную популяцию , Кермак и Маккендрик вывели следующие уравнения:

При формулировке этих уравнений было сделано несколько предположений: во-первых, индивидуум в популяции должен рассматриваться как имеющий равную вероятность заражения болезнью, как и любой другой индивидуум, со скоростью , которая считается скоростью контакта или заражения болезнью. Таким образом, инфицированный индивидуум вступает в контакт и может передать болезнь другим в единицу времени, а доля контактов инфицированного с восприимчивым составляет . Число новых случаев заражения в единицу времени на одного инфицированного тогда составляет , что дает скорость новых случаев заражения (или тех, кто покидает восприимчивую категорию) как (Brauer & Castillo-Chavez, 2001). Для второго и третьего уравнений считайте, что популяция, покидающая восприимчивый класс, равна числу, входящему в инфицированный класс. Однако инфицированные покидают этот класс в единицу времени, чтобы войти в выздоровевший/удаленный класс со скоростью в единицу времени (где представляет собой среднюю скорость выздоровления или средний инфекционный период). Эти процессы, которые происходят одновременно, называются Законом Массового Действия , широко распространенной идеей, что скорость контакта между двумя группами в популяции пропорциональна размеру каждой из затронутых групп (Daley & Gani, 2005). Наконец, предполагается, что скорость заражения и выздоровления намного быстрее, чем временная шкала рождений и смертей, и поэтому эти факторы игнорируются в этой модели.

Более подробную информацию об этой модели можно прочитать на странице «Модель эпидемии» .

Подход основного уравнения

Основное уравнение может выражать поведение ненаправленной растущей сети, где на каждом временном шаге к сети добавляется новый узел, связанный со старым узлом (выбранным случайно и без предпочтений). Первоначальная сеть образована двумя узлами и двумя связями между ними в момент времени , эта конфигурация необходима только для упрощения дальнейших вычислений, поэтому в момент времени сеть имеет узлы и связи.

Основное уравнение для этой сети:

где — вероятность иметь узел со степенью в момент времени , а — временной шаг, когда этот узел был добавлен в сеть. Обратите внимание, что есть только два способа для старого узла иметь связи в момент времени :

После упрощения этой модели распределение степеней равно [43]

На основе этой растущей сети разрабатывается эпидемическая модель, которая следует простому правилу: каждый раз, когда добавляется новый узел и после выбора старого узла для связи, принимается решение: будет ли этот новый узел инфицирован или нет. Основное уравнение для этой эпидемической модели:

где представляет собой решение заражать ( ) или нет ( ). Решая это основное уравнение, получаем следующее решение: [44]

Многослойные сети

Многослойные сети — это сети с множественными видами связей. [45] Попытки моделировать системы реального мира в виде многомерных сетей использовались в различных областях, таких как анализ социальных сетей, [46] экономика, история, городской и международный транспорт, экология, психология, медицина, биология, коммерция, климатология, физика, вычислительная нейронаука, управление операциями и финансы.

Оптимизация сети

Сетевые проблемы, которые включают поиск оптимального способа сделать что-либо, изучаются под названием комбинаторной оптимизации . Примерами являются сетевой поток , задача кратчайшего пути , транспортная задача , задача перевалки , задача местоположения , задача соответствия , задача назначения , задача упаковки , задача маршрутизации , анализ критического пути и PERT (метод оценки и обзора программ).

Взаимозависимые сети

Взаимозависимые сети — это сети, в которых функционирование узлов одной сети зависит от функционирования узлов другой сети. В природе сети редко появляются изолированно, скорее, сети обычно являются элементами более крупных систем и взаимодействуют с элементами в этой сложной системе. Такие сложные зависимости могут оказывать нетривиальное влияние друг на друга. Хорошо изученным примером является взаимозависимость инфраструктурных сетей, [47] электростанции, которые образуют узлы энергосистемы, требуют топлива, поставляемого по сети дорог или труб, и также контролируются через узлы коммуникационной сети. Хотя транспортная сеть не зависит от функционирования энергосистемы, коммуникационная сеть зависит. В таких инфраструктурных сетях нарушение функционирования критического числа узлов либо в энергосистеме, либо в коммуникационной сети может привести к каскадным отказам по всей системе с потенциально катастрофическим результатом для функционирования всей системы. [48] Если бы две сети рассматривались изолированно, этот важный эффект обратной связи не был бы замечен, и прогнозы надежности сети были бы сильно переоценены.

Смотрите также

Ссылки

  1. ^ Комитет по сетевой науке для будущих армейских приложений (2006). Сетевая наука. Национальный исследовательский совет. doi : 10.17226/11516. ISBN 978-0309653886. S2CID  196021177.
  2. ^ Денес Кениг (1990). Теория конечных и бесконечных графов (PDF) (PDF). Биркхойзер Бостон. стр. 45–421. дои : 10.1007/978-1-4684-8971-2. ISBN 978-1-4684-8971-2.
  3. ^ Морено, Джейкоб Леви (2009-04-23). ​​Кто выживет? Основы социометрии, групповой психотерапии и социодрамы . Бикон, Нью-Йорк: Beacon House (опубликовано в 1953 году).
  4. ^ "ЭМОЦИИ, ОТОБРАЖЕННЫЕ НОВОЙ ГЕОГРАФИЕЙ: ДИАГРАММЫ, СТРЕМЯЩИЕСЯ ИЗОБРАЖАТЬ ПСИХОЛОГИЧЕСКИЕ ПОТОКИ ЧЕЛОВЕЧЕСКИХ ОТНОШЕНИЙ. ПЕРВЫЕ ИССЛЕДОВАНИЯ ПОКАЗАЛИ, ЧТО ЦВЕТНЫЕ ЛИНИИ ПОКАЗЫВАЮТ НРАВИТСЯ И НЕПРИЯТИЯ ОТДЕЛЬНЫХ ЛИЦ И ГРУПП. ВЫЯВЛЕНО МНОГО НЕУДАЧНИКОВ Д-Р Дж. Л. МОРЕНО ПОДСЧИТЫВАЕТ, ЧТО В СТРАНЕ НАХОДИТСЯ ОТ 10 ДО 15 МИЛЛИОНОВ ИЗОЛИРОВАННЫХ ЛИЦ". New York Times . 1933-04-17. стр. 17. ProQuest  100744844 . Получено 2024-09-26 .
  5. ^ аб Барабаси, Альберт-Ласло; Альберт, Река (15 октября 1999 г.). «Появление масштабирования в случайных сетях». Наука . 286 (5439): 509–512. arXiv : cond-mat/9910332 . дои : 10.1126/science.286.5439.509. ISSN  0036-8075.
  6. ^ Уоттс, Дункан Дж.; Строгац, Стивен Х. (июнь 1998 г.). «Коллективная динамика сетей «малого мира». Nature . 393 (6684): 440–442. doi :10.1038/30918. ISSN  0028-0836.
  7. ^ Коллиос, Джордж (2011-12-06). «Кластеризация больших вероятностных графов». Труды IEEE по знаниям и инжинирингу данных . 25 (2): 325–336. doi :10.1109/TKDE.2011.243. PMID  13188797. S2CID  5650233.
  8. ^ "APA PsycNet".
  9. ^ ab Lawyer, Glenn (март 2015 г.). «Понимание распространяющейся силы всех узлов в сети». Scientific Reports . 5 (O8665): 8665. arXiv : 1405.6707 . Bibcode :2015NatSR...5E8665L. doi :10.1038/srep08665. PMC 4345333 . PMID  25727453. 
  10. ^ Sikic, Mile; Lancic, Alen; Antulov-Fantulin, Nino; Stefancic, Hrvoje (октябрь 2013 г.). «Эпидемическая центральность – есть ли недооцененное эпидемическое воздействие периферийных узлов сети?». European Physical Journal B. 86 ( 10): 440. arXiv : 1110.2558 . Bibcode : 2013EPJB...86..440S. doi : 10.1140/epjb/e2013-31025-5. S2CID  12052238.
  11. ^ Боргатти, Стивен П. (2005). «Центральность и сетевой поток». Социальные сети . 27 : 55–71. CiteSeerX 10.1.1.387.419 . doi :10.1016/j.socnet.2004.11.008. 
  12. ^ Travençolo, BAN; da F. Costa, L. (2008). «Доступность в сложных сетях». Physics Letters A. 373 ( 1): 89–95. Bibcode : 2008PhLA..373...89T. doi : 10.1016/j.physleta.2008.10.069.
  13. ^ Бендер, Эдвард А.; Кэнфилд, Э.Родни (май 1978). «Асимптотическое число помеченных графов с заданными последовательностями степеней». Журнал комбинаторной теории, серия A. 24 ( 3): 296–307. doi : 10.1016/0097-3165(78)90059-6 . ISSN  0097-3165.
  14. ^ ab Molloy, Michael; Reed, Bruce (март 1995). "Критическая точка для случайных графов с заданной последовательностью степеней". Random Structures & Algorithms . 6 (2–3): 161–180. CiteSeerX 10.1.1.24.6195 . doi :10.1002/rsa.3240060204. ISSN  1042-9832. 
  15. ^ ab Newman, MEJ; Strogatz, SH; Watts, DJ (2001-07-24). "Случайные графы с произвольными распределениями степеней и их приложения". Physical Review E . 64 (2): 026118. arXiv : cond-mat/0007235 . Bibcode :2001PhRvE..64b6118N. doi :10.1103/PhysRevE.64.026118. PMID  11497662. S2CID  360112.
  16. ^ Кривень, Иван (2017-05-02). "Общее выражение для распределения размеров компонентов в сетях бесконечной конфигурации". Physical Review E. 95 ( 5): 052303. arXiv : 1703.05413 . Bibcode : 2017PhRvE..95e2303K. doi : 10.1103/PhysRevE.95.052303. PMID  28618550. S2CID  8421307.
  17. ^ Кривень, Иван (2018-01-01). «Аналитические результаты по модели случайного графа полимеризации». Журнал математической химии . 56 (1): 140–157. arXiv : 1603.07154 . doi : 10.1007/s10910-017-0785-1 . ISSN  0259-9791.
  18. ^ Кривень, Иван (2016-07-27). "Возникновение гигантской слабой компоненты в направленных случайных графах с произвольными распределениями степеней". Physical Review E . 94 (1): 012315. arXiv : 1607.03793 . Bibcode :2016PhRvE..94a2315K. doi :10.1103/PhysRevE.94.012315. PMID  27575156. S2CID  206251373.
  19. ^ Кривень, Иван (2017-11-02). "Конечные связные компоненты в бесконечных направленных и мультиплексных сетях с произвольными распределениями степеней". Physical Review E. 96 ( 5): 052304. arXiv : 1709.04283 . Bibcode : 2017PhRvE..96e2304K. doi : 10.1103/PhysRevE.96.052304. PMID  29347790. S2CID  20741516.
  20. ^ R. Albert; A.-L. Barabási (2002). "Статистическая механика сложных сетей" (PDF) . Reviews of Modern Physics . 74 (1): 47–97. arXiv : cond-mat/0106096 . Bibcode :2002RvMP...74...47A. CiteSeerX 10.1.1.242.4753 . doi :10.1103/RevModPhys.74.47. S2CID  60545. Архивировано из оригинала (PDF) 24.08.2015. 
  21. ^ аб Альберт-Ласло Барабаси и Река Альберт (октябрь 1999 г.). «Появление масштабирования в случайных сетях» (PDF) . Наука . 286 (5439): 509–512. arXiv : cond-mat/9910332 . Бибкод : 1999Sci...286..509B. дои : 10.1126/science.286.5439.509. PMID  10521342. S2CID  524106. Архивировано из оригинала (PDF) 17 апреля 2012 г.
  22. ^ Прайс, Дерек Дж. де Солла (1965-07-30). «Сети научных статей: структура библиографических ссылок указывает на характер научно-исследовательского фронта». Science . 149 (3683): ​​510–515. Bibcode :1965Sci...149..510D. doi :10.1126/science.149.3683.510. ISSN  0036-8075. PMID  14325149.
  23. ^ Прайс, Дерек Де Солла (1976). «Общая теория библиометрических и других кумулятивных преимуществ процессов». Журнал Американского общества информационной науки . 27 (5): 292–306. doi :10.1002/asi.4630270505. S2CID  8536863.
  24. ^ Крапивский, ПЛ; Реднер, С.; Лейвраз, Ф. (20 ноября 2000 г.). «Связность растущих случайных сетей». Physical Review Letters . 85 (21): 4629–4632. arXiv : cond-mat/0005139 . Bibcode : 2000PhRvL..85.4629K. doi : 10.1103/PhysRevLett.85.4629. PMID  11082613. S2CID  16251662.
  25. ^ Крапивский, Пол; Крюков, Дмитрий (21 августа 2008 г.). "Безмасштабные сети как предасимптотические режимы сверхлинейного предпочтительного присоединения". Physical Review E . 78 (2): 026114. arXiv : 0804.1366 . Bibcode :2008PhRvE..78b6114K. doi :10.1103/PhysRevE.78.026114. PMID  18850904. S2CID  14292535.
  26. ^ Хассан, МК; Ислам, Лиана; Арефинул Хак, Сайед (март 2017 г.). «Распределение степеней, распределение рангов и настойчивость лидеров в сетях привязанности, управляемых посредничеством». Physica A. 469 : 23–30. arXiv : 1411.3444 . Bibcode : 2017PhyA..469...23H. doi : 10.1016/j.physa.2016.11.001. S2CID  51976352.
  27. ^ Калдарелли Г., А. Капоччи, П. Де Лос Риос, М. А. Муньос, Physical Review Letters 89, 258702 (2002)
  28. ^ Servedio VDP, Дж. Кальдарелли, П. Бутта, Physical Review E 70, 056126 (2004)
  29. ^ Гарлашелли Д., М.И. Лоффредо Physical Review Letters 93, 188701 (2004)
  30. ^ Чимини Г., Т. Скуартини, Д. Гарлашелли и А. Габриелли, Scientific Reports 5, 15758 (2015)
  31. ^ Люшер, Дин; Коскинен, Йохан; Робинс, Гарри (2012). Экспоненциальные случайные графовые модели для социальных сетей: теория, методы и приложения (структурный анализ в социальных науках) . doi :10.1017/CBO9780511894701. ISBN 9780521141383. OCLC  1120539699.
  32. ^ ab Вассерман, Стэнли и Кэтрин Фауст. 1994. Анализ социальных сетей: методы и приложения. Кембридж: Издательство Кембриджского университета.
  33. ^ Ньюман, MEJ Networks: Введение. Oxford University Press. 2010, ISBN 978-0199206650 
  34. ^ "Toward a Complex Adaptive Intelligence Community The Wiki and the Blog". D. Calvin Andrus . cia.gov. Архивировано из оригинала 13 июня 2007 г. Получено 25 августа 2012 г.
  35. ^ "Анализ сетей террористов". Архивировано из оригинала 2012-11-23 . Получено 2011-12-12 .
  36. ^ Доктор философии, Мартин Бушар; доктор философии, Айли Мальм (2016-11-02). «Анализ социальных сетей и его вклад в исследования преступности и уголовного правосудия». Oxford Handbooks Online: Криминология и уголовное правосудие . doi :10.1093/oxfordhb/9780199935383.013.21. ISBN 978-0-19-993538-3.
  37. ^ Гросс, Т. и Саяма, Х. (ред.). 2009. Адаптивные сети: теория, модели и приложения. Springer.
  38. ^ Холм, П. и Сарамяки, Дж. 2013. Временные сети. Springer.
  39. ^ Ксантос, Арис, Панте, Исаак, Роша, Янник, Гранжан, Мартин (2016). Визуализация динамики сетей персонажей. В «Цифровых гуманитарных науках», 2016: Ягеллонский университет и Педагогический университет, Краков, стр. 417–419.
  40. ^ Barabási, AL; Gulbahce, N.; Loscalzo, J. (2011). «Сетевая медицина: сетевой подход к человеческим болезням». Nature Reviews Genetics . 12 (1): 56–68. doi :10.1038/nrg2918. PMC 3140052. PMID  21164525 . 
  41. ^ Сегев, Элад (2022). Семантический сетевой анализ в социальных науках. Лондон: Routledge. ISBN 9780367636524. Архивировано из оригинала 5 декабря 2021 г. . Получено 5 декабря 2021 г. .
  42. ^ Ньюман, М., Барабаши, А.-Л., Уоттс, ДЖ. [ред.] (2006) Структура и динамика сетей. Принстон, Нью-Джерси: Princeton University Press.
  43. ^ Дороговцев, SN; Мендес, JFF (2003). Эволюция сетей: от биологических сетей к Интернету и WWW . Нью-Йорк, Нью-Йорк, США: Oxford University Press, Inc. ISBN 978-0198515906.
  44. ^ Котакаллапа, М.; Хасе, МО (2016). «Эпидемии в сетях: подход с использованием основного уравнения». Journal of Physics A. 49 ( 6): 065001. arXiv : 1604.01049 . Bibcode : 2016JPhA...49f5001C. doi : 10.1088/1751-8113/49/6/065001. S2CID  119206200.
  45. ^ Де Доменико, Манлио (31 марта 2022 г.). Многослойные сети: анализ и визуализация (1-е изд.). Springer.
  46. ^ Росси, Лука; Дикисон, Марк Э.; Маньяни, Маттео (18 июля 2016 г.). Многослойные социальные сети (1-е изд.). Cambridge University Press.
  47. ^ «Определение, понимание и анализ критических взаимозависимостей инфраструктуры». Журнал IEEE Control Systems . 21 (6): 11–25. Декабрь 2001. doi :10.1109/37.969131.
  48. ^ Булдырев, Сергей В. и др. (апрель 2010 г.). «Катастрофический каскад отказов во взаимозависимых сетях». Nature . 464 (7291): 1025–1028. arXiv : 0907.1182 . Bibcode :2010Natur.464.1025B. doi :10.1038/nature08932. PMID  20393559. S2CID  1836955.

Дальнейшее чтение