Блочное моделирование — это набор или последовательная структура , которая используется для анализа социальной структуры , а также для установки процедур для разбиения (кластеризации) единиц социальной сети ( узлов , вершин , участников ) на основе определенных шаблонов, которые формируют отличительную структуру посредством взаимосвязи. [1] [2] В основном она используется в статистике , машинном обучении и сетевой науке .
Как эмпирическая процедура , блочное моделирование предполагает, что все единицы в определенной сети могут быть сгруппированы вместе в такой степени, в которой они эквивалентны. Что касается эквивалентности, она может быть структурной, регулярной или обобщенной. [3] Используя блочное моделирование, сеть может быть проанализирована с использованием вновь созданных блочных моделей , что преобразует большую и сложную сеть в меньшую и более понятную. В то же время блочное моделирование используется для операционализации социальных ролей .
В то время как некоторые утверждают, что блочное моделирование — это всего лишь методы кластеризации, Боначич и Макконахи утверждают, что «это теоретически обоснованный и алгебраический подход к анализу структуры отношений». Уникальная способность блочного моделирования заключается в том, что оно рассматривает структуру не только как набор прямых отношений, но и учитывает все другие возможные составные отношения, которые основаны на прямых. [4]
Принципы блочного моделирования были впервые введены Франсуа Лорреном и Харрисоном К. Уайтом в 1971 году. [2] Блочное моделирование рассматривается как «важный набор инструментов сетевого анализа», поскольку оно имеет дело с разграничением ролевых структур (четко определенных мест в социальных структурах, также известных как позиции) и распознаванием фундаментальной структуры социальных сетей. [5] : 2, 3 По словам Батагеля , основная «цель блочного моделирования состоит в том, чтобы свести большую, потенциально бессвязную сеть к меньшей понятной структуре, которую можно было бы интерпретировать более легко». [6] Блочное моделирование изначально использовалось для анализа в социометрии и психометрии , но теперь распространилось и на другие науки. [7]
Сеть как система состоит из (или определяется) двух различных наборов: один набор единиц (узлов, вершин, акторов) и один набор связей между единицами. Используя оба набора, можно создать граф , описывающий структуру сети. [8]
В процессе блочного моделирования исследователь сталкивается с двумя проблемами: как разбить блоки (например, как определить кластеры ( или классы), которые затем образуют вершины в блочной модели) и как затем определить связи в блочной модели (и одновременно значения этих связей) [9] .
В социальных науках сети обычно являются социальными сетями , состоящими из нескольких индивидуумов (единиц) и выбранных социальных отношений между ними (связей). Реальные сети могут быть большими и сложными; блочное моделирование используется для упрощения их до более мелких структур, которые можно легче интерпретировать. В частности, блочное моделирование разбивает единицы на кластеры, а затем определяет связи между кластерами. В то же время блочное моделирование может использоваться для объяснения социальных ролей, существующих в сети, поскольку предполагается, что созданный кластер единиц имитирует (или тесно связан) с социальными ролями единиц. [8]
Таким образом, блочное моделирование можно определить как набор подходов для разбиения единиц на кластеры (также известные как позиции) и связей на блоки, которые далее определяются вновь полученными кластерами. Блок (также блочная модель) определяется как подматрица, которая показывает взаимосвязь (связи) между узлами, присутствующими в одном и том же или разных кластерах. [8] Каждая из этих позиций в кластере определяется набором (не)прямых связей с другими социальными позициями и из них. [10] Эти связи (соединения) могут быть направленными или ненаправленными; может быть несколько связей между одной и той же парой объектов, или они могут иметь веса на них. Если в сети нет нескольких связей, она называется простой сетью. [11] : 8
Матричное представление графа состоит из упорядоченных единиц, в строках и столбцах, на основе их имен. Упорядоченные единицы со схожими моделями связей разделяются вместе в одних и тех же кластерах. Затем кластеры располагаются вместе так, чтобы единицы из одних и тех же кластеров располагались рядом друг с другом, тем самым сохраняя взаимосвязь. На следующем этапе единицы (из одних и тех же кластеров) преобразуются в блочную модель. При этом обычно формируется несколько блочных моделей, одна из которых является основным кластером, а другие — связными; основной кластер всегда связан со связными, в то время как связные не могут быть связаны друг с другом. Кластеризация узлов основана на эквивалентности , такой как структурная и регулярная. [8] Основная цель матричной формы — визуально представить отношения между лицами, включенными в кластер. Эти связи кодируются дихотомически (как присутствующие или отсутствующие), а строки в матричной форме указывают источник связей, а столбцы представляют место назначения связей. [10]
Эквивалентность может иметь два основных подхода: эквивалентные единицы имеют одинаковую схему соединения с теми же соседями или эти единицы имеют одинаковую или похожую схему соединения с разными соседями. Если единицы соединены с остальной частью сети идентичными способами, то они структурно эквивалентны. [3] Единицы также могут быть регулярно эквивалентны, когда они эквивалентно соединены с эквивалентными другими. [2]
При блочном моделировании необходимо учитывать вопрос влияния на результаты ошибок измерений на начальном этапе получения данных. [12]
Что касается того, какой тип сети подвергается блочному моделированию, необходим другой подход. Сети могут быть однорежимными или двухрежимными. В первом случае все блоки могут быть подключены к любому другому блоку, и блоки имеют один и тот же тип, тогда как во втором случае блоки подключены только к блоку(ам) другого типа. [5] : 6–10 Что касается отношений между блоками, они могут быть однореляционными или многореляционными сетями. Более того, сети могут быть временными или многоуровневыми, а также бинарными (только 0 и 1) или знаковыми (допускающими отрицательные связи)/значениями (возможны и другие значения).
Различные подходы к блочному моделированию можно сгруппировать в два основных класса: детерминированное блочное моделирование и стохастическое блочное моделирование. Детерминированное блочное моделирование затем далее делится на прямые и косвенные блочные моделирующие подходы. [8]
Среди подходов прямого блочного моделирования: структурная эквивалентность и регулярная эквивалентность . [2] Структурная эквивалентность — это состояние, когда блоки связаны с остальной частью сети идентичным образом(ами), в то время как регулярная эквивалентность имеет место, когда блоки одинаково связаны с другими эквивалентными блоками (блоки не обязательно имеют общих соседей, но имеют соседей, которые сами по себе похожи). [3] [5] : 24
Косвенные подходы блочного моделирования, в которых разбиение рассматривается как традиционная задача кластерного анализа (измерение (нес) сходства приводит к матрице (нес)сходства), следующие: [8] [2]
По мнению Бруско и Стейнли (2011), [14] блочное моделирование можно классифицировать (используя ряд измерений): [15]
Блочные модели (иногда также блочные модели ) — это структуры, в которых:
Компьютерные программы могут разбивать социальную сеть в соответствии с заранее заданными условиями. [17] : 333 Когда эмпирические блоки могут быть разумно аппроксимированы в терминах идеальных блоков, такие блочные модели могут быть сведены к блочному изображению , которое является представлением исходной сети, фиксируя ее базовую «функциональную анатомию». [18] Таким образом, блочные модели могут «позволить данным характеризовать свою собственную структуру», и в то же время не стремиться демонстрировать предвзятую структуру, навязанную исследователем. [19]
Блочные модели могут быть созданы косвенно или напрямую, на основе построения критериальной функции . Косвенное построение относится к функции, основанной на «совместимой (не)сходной мере между парами единиц», в то время как прямое построение — это «функция, измеряющая соответствие реальных блоков, вызванное заданной кластеризацией , соответствующим идеальным блокам с идеальными отношениями внутри каждого кластера и между кластерами в соответствии с рассматриваемыми типами связей ( эквивалентностью )». [20]
Блочные модели могут быть определены относительно интуиции , сущности или понимания природы изучаемой сети; это может привести к таким моделям, как: [5] : 16–24
Блочное моделирование выполняется с помощью специализированных компьютерных программ , предназначенных для анализа сетей или блочного моделирования в частности, таких как: