Анализ социальных сетей
Анализ социальных сетей - учебная аналитика
Содержание
|
Определение
Анализ социальных сетей представляет собой специальную методологию и набор способов исследования, позволяющих изучать в формализованном виде связи между участниками социальных сетей (акторами).
Анализ социальных сетей (social network analysis, SNA) — направление современной компьютерной социологии, которое занимается описанием и анализом возникающих в ходе социального взаимодействия и коммуникации связей (сетей) различной плотности и интенсивности.
Сеть социальных взаимодействий — это сеть, состоящая из так называемых социальных акторов (актор — от англ. actor (деятель, личность) — термин используется в русскоязычной литературе и имеет более широкое значение, чем русское слово «лицо», то есть это может быть не только человек или юридическое лицо, но и совокупность организаций или целая страна) и наборов взаимосвязей между ними.
При анализе социальных сетей внимание уделяется связям, а не самим действующим лицам. Как правило, социальная сеть описывается графом или матрицей взаимоотношений.
В целом предметом статистического анализа является структура связей и отношений (то есть повторяющиеся, регулярные паттерны коммуникаций и обмена) между людьми, входящими в разнообразные и разномасштабные общности. Математический аппарат, используемый для анализа, позволяет изучать с помощью взаимосвязанных данных и переменных свойства связей и отношений. Кроме того, с его помощью возможно параллельно исследовать данные разного уровня: поведение отдельных участников, различных подгрупп, особенности позиций в общности и свойства сети в целом. С самого начала анализ проводился на междисциплинарной основе и объединял психологов, антропологов, социологов, математиков, специалистов по коммуникации.
Анализ социальных сетей фактически есть способ формальной репрезентации данных о связях участников (акторов) с помощью социометрической матрицы, которая представлена в виде таблицы, элементы которой численно выступают как сила связи между актором в i-й строке и актором в j-м столбце. Такой матрице может быть сопоставлен граф — множество вершин и связей между акторами. Связи эти могут быть ненаправленными (ребра) и направленными (дуги). Граф с заданными дугами называется ориентированным. Вершины, соединенные ребром, являются смежными. Последовательность смежных вершин составляет цепь; последовательность же вершин, соединенных дугами, называется путем. Направление связей между вершинами цепи не имеет значения. Число ее ребер — это длина. Длина самой короткой цепи, связывающей две вершины, называется расстоянием между вершинами (без учета направления связей). Что касается пути, то число дуг, составляющих его, называется длиной направление связей существенно). Длину самого короткого пути, связывающего две вершины, называют расстоянием между ними (с учетом направления связей). Таким образом, любую социальную сеть можно математически изобразить в виде графа. При этом она бывает как в режиме онлайн (в Интернете), так и реальной системой связей между людьми: в качестве примера исследователи очень часто используют сети, представляющие родственные и брачные отношения в аристократических семьях.
- Лифинцев Д.В. Оценка связей индивида в микросоциуме на основе методов анализа социальных сетей // Вестник Балтийского федерального Университета им. И. Канта. 2013. № 5. С. 77–84.
История
- Первые работы по изучению социальных сетей были сделаны в начале 30-х годов 20 века для объяснения способов общения и взаимодействия внутри групп. Морено использовал термин социограмма для визуального представления социальной сети. В этой сети узлы представляли отдельных людей, а ребра отношения между людьми. Идея метода Морено состоит в построении системы графических связей внутри сообщества, основанная на выборах (односторонних или взаимных), которые члены этого сообщества делают, отвечая на такие вопросы, как «Кого бы вы хотели (не хотели) выбрать своим бригадиром?» или «Кого бы вы хотели (не хотели) пригласить на встречу Нового года?» Полученные ответы позволяют интерпретировать (визуализировать) картину отношений внутри сообщества, в частности, в виде социограммы. Безусловными плюсами метода социометрии с последующей визуализацией полученных данных в социограмме является относительная легкость проведения этой методики, получение, в целом, надежных сведений в виде кластеров (группировок) внутри сообщества и наглядность полученной картины.
- Термин «Социальная сеть» ввел социолог Джеймс Барнс в 1954 году, говоря о сложных взаимоотношениях между субъектами общества.
- Первые математические модели социальных сетей созданы выходцем из России Анатолием Раппопортом.
- Мильграм поставил эксперименты по вычислению количества узлов между двумя жителями США из разных штатов.
- Эрдос и Реньи - модель случайного графа. Исторически изучением сложных сетей занимается теория графов. В то время как теория графов изначально описывала регулярные графы, начиная с 1950-го года, сложные сети, не имевшие очевидных принципов построения, стали описывать с помощью теории случайных графов, предложенных в качестве наиболее подходящей модели сложных сетей. Впервые случайные графы были изучены венгерскими математиками Полом Эрдосом (Paul Erdős) и Альфредом Реньи (Alfred Rényi).
- Д.Уотс предложил свою модель формирования сетей, в которой сеть росла не случайным образом. Образование новой связи между узлами зависело от числа уже имеющихся общих друзей.
- Л.Барабаши сформулировал теорию безмасштабных сетей или масштабно-инвариантной сети. Безмасштабные сети(scale-free network) - это случайные графы, где распределение связей узлов - степенное и основные свойства сети не зависят от размера сети. Во многих сетях - от Всемирной паутины до метаболической системы клетки - доминирует относительно небольшое число узлов (концентраторов), имеющих практически неограниченное количество связей. Таким структурам свойственна масштабная инвариантность, поэтому мы дали им название безмасштабные сети (scale-free networks). Их поведение подчиняется определенным закономерностям: например, они необычайно стойки к случайным отказам, но чрезвычайно уязвимы для скоординированных атак.
Барабаши и Уотс рассказывают о своих работах:
- Barabasi, Albert-Laszlo and Reka, Albert. Emergence of scaling in random networks. Science, 286:509-512, October 15, 1999.
- Морено Дж. Л. Социометрия. Экспериментальный метод и наука об обществе. Пер с англ. 1958.
- J. L. Moreno, Who Shall Survive?, Beacon House, Beacon, NY, 1934.
- John Scott Social network analysis
- Случайные графы http://rain.ifmo.ru/cat/view.php/theory/graph-general/random-2005
- Анализ безмасштабных сетей Павел Велихов, ИСП РАН http://synthesis.ipi.ac.ru/sigmod/seminar/s20070329
- M. E. J. Newman The structure and function of complex networks (2003) http://stat.gamma.rug.nl/snijders/Newman2003.pdf
Ключевые понятия и измерения
Общие понятия
- Вероятность связывания новых узлов к существующим узлам определяется тем, сколько узлов уже связаны с данным узлом. Другими словами, богатые узлы становятся богаче.
- В большинстве реальных сетей тесно связанные группы связаны между собой через мосты.
- Личные сети. Сети друзей-друзей-друзей - Непотизм - семейственность.
- Социальный капитал.
- Социограмма
Традиционно для обозначения отдельного элемента социальной сети используют понятие «узел», если речь идет об исследованиях прикладного математического характера, или «актор», если подразумевается социологические исследования. В целом узел и актор по сути представляет собой отдельного человека (в социальных сетях), выступающего субъектом связей с другими индивидами.
Сетевые метрики
Показатели, которые используются при анализе социальных сетей. См. Сетевые метрики - таблица
Плотность
Плотность – это отношение числа имеющихся рёбер графа к максимально возможному количеству рёбер данного графа. Плотность – распространённая метрика, она используется в первую очередь при сравнении графов одного размера, или при сравнении графа с самим собой во времени. Вычисляется она по формуле:
D = n существующих связей/n максимально возможных
2 * L / (g * (g - 1 )) - где L - число связей, а g - число вершин в графе
Например, если в системе 924 участника и между ними установлены 2561 связь, то плотность равна
(2 * 2561) / (924 * 923) = 0.006005731357844034
Для NetLogo в ситуации, когда есть участники и связи между ними, рассчитывается по формуле
to-report density if count users > 2 [ report (2 * count links) / ( (count users) * ( (count users) - 1) )] report 0 end
Коэффициент кластеризации
Кластеризация – это локальная характеристика сети. Она характеризует степень взаимодействия между собой ближайших соседей данного узла. В большинстве сетей, если узел А соединен с узлом В, а узел В – с узлом С, то существует большая вероятность, что узел А соединен с узлом С (друзья наших друзей обычно также являются и нашими друзьями).
Коэффициент кластеризации данного узла есть вероятность того, что два ближайших соседа этого узла сами есть ближайшие соседи.
Коэффициент С соответствует отношению реального числа связей между его соседями и их потенциально возможного числа. Для узла i Ci = Ei/[ki(ki-1)/2], где Ei реальное число связей, ki – степень узла, а в знаменателе записано суммарное число потенциально возможных связей между непосредственными соседями узла i (при котором сеть или еѐ часть превращается в полный граф).
Коэффициент кластеризации может быть усреднен для любой части сети или для сети в целом, становясь ее интегральной характеристикой: C = 1/n ΣCi.
Усредненный коэффициент кластеризации для групп участников школьной сети. Если мы можем по какому либо принципу выделить группу участников, то мы можем определить коэффициент кластеризации в пределах данной группы. Для членов устойчивой группы - клики - коэффициент кластеризации = 1.
Коэффициент кластеризации – это метрика, которая является более эффективной, чем плотность, и её всё чаще используют в общественных науках. Коэффициент кластеризации – степень, определяющая насколько узлы стремятся к кластеризации. Например, в сети друзей это вероятность того, что 2 моих друга являются друзьями между собой. То есть это некоторая оценка фрагментированности сети. При высокой кластеризации можно ожидать, что вирус будет распространяться лишь в определенной подгруппе (кластере). При низкой кластеризации высока вероятность быстрого распространения вируса по всей сети
Локальный коэффициент кластеризации
Коэффициент локального объединения в кластеры (коэффициент кластеризации) является мерой того, насколько хорошо связанны связаны между собой соседи данного узла. Локальный коэффициент кластеризации рассчитывается как число связей межу соседями данного узла / возможное число связей между соседями.
NetLogo позволяет рассчитывать
turtle nw:clustering-coefficient - local clustering coefficient of the turtle.
Reports the local clustering coefficient of the turtle. The clustering coefficient of a node measures how connected its neighbors are. It is defined as the number of links between the node's neighbors divided by the total number of possible links between its neighbors.
nw:clustering-coefficient takes the directedness of links into account. A directed link counts as a single link whereas an undirected link counts as two links (one going one-way, one going the other).
Мы всегда рассматриваем ситуацию как сравнение числа существующих связей к числу возможных связей. Есть узлы, все соседи которых связаны между собой. Есть узлы между соседями которых вообще нет никаких связей. И опять это ситуация, когда есть развитая сеть и все соседи связаны между собой - это сообщество, это клика, где все друг с другом связаны.
Чем выше локальный коэффициент кластеризации, тем выше вероятность того, что участник данный участник входит в состав устойчивой группы и обладает социальными компетенциями, необходимыми для использования объектов, созданные другими участниками, и создания объектов, нужных другим участникам.
Закономерности: - Закон Меткалфа
Если рассматривать ценность сети с педагогической точки зрения - как создание устойчивых связей между всеми акторами сети, то для отдельного участника число его связей с другими участниками / на возможное число связей.
Глобальный коэффициент кластеризации
Коэффициент кластеризации – это значения кластеризации для всех узлов графа. Когда коэффициент кластеризации высокий – это означает, что граф чрезвычайно плотно сгруппирован вокруг нескольких узлов; когда он низкий – это значит, что связи в графе относительно равномерно распространены среди всех узлов.
Вычисляется на основании того сколько треугольников сложено в сети от возможного количества треугольников. Например, на следующей картинке коэффициент кластеризации равен 1/3 - потому что там моглор бы быть 3 треугольника, а сложился только 1
The global clustering coefficient measures how much nodes tend to cluster together in the network in general. It is defined based on the types of triplets in the network. A triplet consists of a central node and two of its neighbors. If its neighbors are also connected, it's a closed triplet. If its neighbors are not connected, it's an open triplet. The global clustering coefficient is simply the number of closed triplets in a network divided by the total number of triplets. It can be calculated from the local clustering coefficient quite easily with the following code
to-report global-clustering-coefficient let closed-triplets sum [ nw:clustering-coefficient * count my-links * (count my-links - 1) ] of turtles let triplets sum [ count my-links * (count my-links - 1) ] of turtles report closed-triplets / triplets end
transitivity(g, type="local") order(transitivity(g, type="local"))
Насколько узлам свойственно объединяться в кластеры
Усредненный коэффициент кластеризации - The average local clustering coefficient is another popular method for measuring the amount of clustering in the network as a whole. It may be calculated with
mean [ nw:clustering-coefficient ] of turtles
Biconnected component - компонента сильной связности
nw:bicomponent-clusters
Возвращает список бикомпонентных кластеров в текущем сетевом контексте. Бикомпонента (a maximal biconnected subgraph)- часть сети, которая не может быть разъединена благодаря удалению только одного связующего узла (шарнира). Чтобы рассыпать граф необходимо удалить хотя бы 2 узла. Бикомпонента (Strongly connected component) — максимальный по включению вершин сильно связный подграф орграфа.
Reports the list of bicomponent clusters in the current network context. A bicomponent (also known as is a part of a network that cannot be disconnected by removing only one node (i.e. you need to remove at least two to disconnect it). The result is reported as a list of agentsets, in random order. Note that one turtle can be a member of more than one bicomponent at once.
В исследовании школьной сети с GoogleApps было выделено 2 заметных бикомпоненты:
В первой бикомпоненте более 280 узлов
Во второй бикомпоненте только 6 узлов и здесь проще читается основное правило сильной бикомпоненты - все узлы внутри бикомпоненты связаны более чем с одним узлом и нет узла, удаление которого привело бы к утрате связей между акторами сети.
Компонента слабой связности
nw:weak-component-clusters
Reports the list of "weakly" connected components in the current network context. A weakly connected component is simply a group of nodes where there is a path from each node to every other node. A "strongly" connected component would be one where there is a directed path from each node to every other. The extension does not support the identification of strongly connected components at the moment.
The result is reported as a list of agentsets, in random order. Note that one turtle cannot be a member of more than one weakly connected component at once.
Degree
Количество узлов, связанных с данным узлом - степень данного узла.
Близость - Closeness
Мера скорости передачи информации. Как долго будет происходить передача информации от данного узла к другим связанным узлам. Инверсия суммы кратчайших расстояний между каждым узлом и каждым другим узлом в сети. Близость показывает, насколько просто одному узлу связаться с другим узлом. Чем меньше узлов-посредников между текущем узлом и другими узлами, тем ниже показатель близости и выше степень близости. Если узел централен, то он может быстро взаимодействовать с другими узлами.
Центральность (Близость к центру)
Для анализа связей в социальной сети используют различные индивидуальные и групповые показатели, позволяющие оценить степень заметности и влияния акторов друг на друга. Собственно идея центральности вершин в графе, их значения появилась одной из первых в методологии анализа социальных сетей, и напрямую может быть увязана с первыми попытками Дж. Морено выявить самых популярных участников в группе («социометрических звезд»). Позднее эта мера заметности актора в сети стала называться центральностью.
Близость к центру или Степень центральности (Degree centrality) – показывает, кто является наиболее активным узлом в сети. Измеряется количеством связей с другими узлами в сети. Центральность показывает, насколько данный узел близок по отношению к другим узлам в сети. В соответствие с теорией сетей большое количество взаимодействий узла может не только изменить позицию узла в сети, но также и изменить позиции других узлов.
- Престиж узла: входная степень узла (in-degree) — количество ребер графа, входящих в узел.
- Влияние узла: выходная степень узла (out-degree) — количество ребер графа, исходящих из узла. Эта характеристика показывает, кто является наиболее активным в сети. Индивидуальный показатель близости к центру показывает, в какой степени узел связан остальными узлами, то есть насколько тесно он связан с группой.
- Freeman L.C. Centrality in social networks: Conceptual clarification // Social Networks. 1979. Т. 1. № 3. С. 215–239.
Мера центральности описывает выдающееся положение конкретного узла по сравнению с другими узлами. Средняя мера центральности также известна как централизованная оценка и указывает, насколько плотен граф по отношению к каждому узлу. Есть три показателя центральности: центральность по степени, центральность по близости и центральность по посредничеству.
Центральность по степени
Смысл этой меры основан на допущении, что тот, кто обладает большим количеством связей (отношений) с другими, занимает центральное положение в локальной общности.
Центральность по степени – это отношение количества связей определённого узла к общему количеству других узлов. В случае направленной сети существует две отдельных меры ЦС: входящая (indegree) и исходящая (outdegree). Входящая указывает число связей, направленных к узлу, а исходящая – число связей, направленных от узла. Если ЦС = 1, это указывает на то, что определённый узел связан со всеми остальными узлами сети, в то время как ЦС = 0 указывает на то, что узел изолирован. Так как многие интернет-сети являются направленными, есть определённый смысл в том, чтобы использовать входящую и исходящую центральность по степени. Высокая исходящая центральность по степени указывает на то, что узел является «властным»; это такой тип человека или сайта, который может быстро распространить информацию среди других людей. Высокая входящая центральность по степени указывает, что узел – «знаменитость»; это значит, что за таким типом человека или сайта будет следить много людей. Google.com имеет миллиарды внешних ссылок на другие сайты. Это – власть. YouTube.com имеет относительно немного ссылок на другие сайты, однако, много людей размещают ссылки на YouTube или встраивают его контент на собственные страницы. Это – известность.
Недостатком такой меры является то, что количество социальных контактов зачастую не отражает их качества, а просто свидетельствует о степени общительности индивида.
Если позиция, занимаемая актором-мостом, отличается высокой степенью центральности (degree centrality), то есть он имеет больше прямых связей с акторами, чем другие, он может широко распространять свои коммуникативные темы в тех сплоченных подгруппах, к которым принадлежит, тем самым внося вклад в сближение структуры и состава полей знания соответствующих РКС (распределенная когнитивная система). Чем меньше таких акторов, чем центральнее их позиция, тем больший вклад в обеспечение конгруэнтности полей знания они способны внести. Если же актор-мост в большой мере промежуточно централен (betweenness centrality), то есть чаще других находится на пути от одного актора сети к другому, он может контролировать значительное число информационных потоков между сплоченными подгруппами, членом которых является, а следовательно, ограничивать разнообразие информации. Его ошибки, намеренная дезинформация или необычные, творческие коммуникативные практики способны порождать наиболее отклоняющиеся информационные вариации в полях знания РКС. В случае, когда относительное количество таких акторов и их коммуникаций велико, они усиленно раздражают друг друга и порождают множество отклонений-новаций, а сопряжение между подгруппами сети, по-видимому, усиливается. Если же акторы скорее склонны ограничивать проходящую информацию, то сопряжение, вероятнее всего, будет ослабевать.
- Басов Н.В. Создание знания в сетевых коммуникативных структурах // Социологический журнал. 2014. № 1. С. 106–123.
Центральность по близости closeness-centrality
Центральность по близости выражает, насколько близко узел расположен к остальным узлам сети. По мнению Фримана, это мера эффективности, так как узел, который является наиболее близким к остальным узлам графа, лучше всех подвержен восприятию новой информации или вируса. Формально центральность по близости выражается как отношение числа других узлов графа к сумме расстояний между определённым узлом и всеми другими. Если БЦ = 1, это означает, что определённый узел связан со всеми другими узлами. Вероятно, что сайты СМИ, которые имеют блог-платформы, такие как Gizmodo.com и DailyKOS.com имеют очень высокий показатель БЦ. Они содержат ссылки на большое количество других сайтов, и многие другие сайты, в свою очередь, ссылаются на них.
Центральность по близости (Closeness centrality) является показателем того, насколько быстро распространяется информация в сети от одного участника к остальным, то есть насколько близок рассматриваемый участник ко всем остальным участникам сети.
Показатель «центральность по близости» (closeness centrality) демонстрирует, насколько легко достичь определенного узла в сети. Если говорить о футболе, то этот показатель позволяет судить, как этот игрок взаимодействует с командой.
Суть его состоит в том, чтобы оценить насколько близок (то есть включен в непосредственное взаимодействие) актор ко всем остальным участникам сети. Для того чтобы иметь высокую степень данного вида центральности, актор должен не просто обладать множеством связей. Важно, чтобы у его друзей и партнеров тоже их было достаточно. Это означает, что актор с высокой степенью центральности по близости через те связи, в которые он включен, получает возможность доступа к большому количеству других участников сети, распространяя свое влияние на них. Не случайно так называемые влиятельные распространители информации имеют высокую степень центральности по близости. Например, если актор знает всех субъектов сети, то степень его центральности будет равна единице
The closeness centrality of a turtle is defined as the inverse of the average of it's distances to all other turtles. - Обратное среднему от расстояний до всех других черепах.
см. https://github.com/NetLogo/NW-Extension - Сетевое расширение NetLogo - и отдельный раздел о измерении центральности
Если речь идет о распространении данных и выявлении информационных потоков в организации, а исследователь заинтересован в поиске акторов, которые могут наиболее эффективно принимать и передавать их, то более всего подходит измерение центральности по близости, поскольку для получения информации нужно быть рядом с остальными. В этом случае акторы, имеющие в среднем более короткую дистанцию до других участников сети, могут наиболее эффективно передавать и получать информацию.
Центральность по посредничеству betweenness-centrality
Центральность по посредничеству - вынесено в отдельную статью по причине значимости
Групповые показатели центральности
Групповые показатели центральности являются мерами изменчивости или неравенства индивидуальных показателей в графе и показывают насколько различаются акторы по степени индивидуальной центральности. В таком общем понимании групповые индексы по смыслу близки дисперсии (мере разброса). По причинам математического свойства наиболее популярны групповые индексы Фримана по степени, близости или посредничеству. Каждый из этих показателей равен сумме отклонений индивидуальных показателей от максимального наблюдаемого, отнесенной к теоретически возможному максимуму сумм отклонений. Знаменатель получают аналитически. Групповые индексы равны нулю в том случае, когда все индивидуальные показатели равны, и 100, если в графе доминирует одна вершина. В отличие от дисперсии, групповые индексы не зависят от размера графа.
Для группового показателя центральности по посредничеству = Sum (maxV - Vi)/ (((N - 1)* (N - 1) * (N - 2) ) / 2)
to-report centralization let znm ((count turtles - 1) * (count turtles - 1) * (count turtles - 2)) / 2 ; let mx max [nw:betweenness-centrality] of turtles ; report (sum map [mx - ?] [nw:betweenness-centrality] of turtles ) / znm end
Групповая центральность по посредничеству в NetLogo. Групповая центральность по посредничеству позволяет сравнивать проекты совместной сетевой деятельности независимо от числа участников
Мера центральности по собственному вектору eigenvector-centrality
nw:eigenvector-centrality
Центральность по собственному вектору (Eigenvector centrality) демонстрирует зависимость между центральностью участника и центральностями его друзей.
The Eigenvector centrality of a node can be thought of as the amount of influence a node has on a network. In practice, turtles that are connected to a lot of other turtles that are themselves well-connected (and so on) get a higher Eigenvector centrality score.
Черепаха, которая имеет много связей с теми, у кого тоже много связей, имеет высокую центральность по собственному вектору.
Мера центральности по собственному вектору (eigenvector centrality) еще более сложна для вычисления и возможна только с помощью специализированных компьютерных программ. Идея ее измерения основана на принципе «скажи мне, кто твой друг, и я скажу, кто ты». Здесь усилия направлены на то, чтобы найти центральных акторов (то есть с наименьшей удаленностью от других) в условиях глобальной или масштабной, сложной по структуре сети, имеющих множество подгрупп, и преодолеть ограничение моделей, более подходящих для анализа локальных сообществ и сетей.
page-rank
weighted-closeness-centrality
nw:weighted-closeness-centrality
Анализ сплоченных подгрупп
Анализ сплоченных подгрупп. Сплоченность принадлежит к числу основных характеристик социальных групп. В широком смысле она понимается как единство, общность норм и интересов, взаимные симпатии членов группы. Основными индикаторами сплоченности в А.С.С. выступают взаимность и частота контактов акторов, близость и достижимость вершин графа. В разумно больших сетях обычно обнаруживают несколько пересекающихся сплоченных подгрупп. Для аналитика интерес представляют количество, состав, размер, а также степень взаимного пересечения подгрупп. Большинство методов этого раздела разработаны для ненаправленных дихотомических связей, и компьютерные программы анализа сетей приводят социоматрицы к симметричному виду.
Простейшим методом анализа сплоченных подгрупп является идентификация клик. В терминах теории графов это максимальный полный подграф, включающий не менее трех вершин. По определению, все вершины клики связаны между собой, и при добавлении любой другой вершины это свойство теряется. Следует иметь в виду, что в отечественной социальной психологии закрепилось определение клики как сплоченной асоциальной группировки. Понятие клики является чрезмерно строгим, а полученные подмножества акторов неустойчивы: удаление или случайное отсутствие одной связи разрушает клику. Чтобы ослабить это ограничение, были разработаны другие меры сплоченности подгрупп. Они основаны либо на понятии достижимости вершин в подграфе, либо на степени вершины (смежность с другими).
Клика порядка n (n-клика) определена как максимальный подграф, в котором наибольшее расстояние между вершинами не превышает заданной величины n. Основным недостатком этого подхода является то, что наикратчайшие пути между членами n-клики могут проходить через посредников, которые сами не принадлежат сплоченной подгруппе. Это обстоятельство может создавать трудности в интерпретации результатов. Скорректированное понятие называется кланом порядка n. Кланы получают исключением из найденных n-клик подгрупп с диметром (наибольшим из самых коротких расстояний между вершинами), превышающим заданное n. Алгоритм поиска клик и кланов заданного порядка обычно приводит к большим подгруппам.
maximal-cliques
- nw:maximal-cliques
- A clique is a subset of a network in which every node has a direct link to every other node. A maximal clique is a clique that is not, itself, contained in a bigger clique.
Клика, которая не является подмножеством более крупной клики.
Как достать клику размером больше N ?
show count turtle-set filter [count ? > 4] nw:maximal-cliques ;; = Сколько участников входит в клики размером от 5 ? ask turtle-set filter [count ? > 4] nw:maximal-cliques [set size 2] ;; всем, кто входит в клики от 5 агентов foreach filter [count ? > 4] nw:maximal-cliques [ask ? [bank_color]]
Очень показательная картинка, где в центре основная клика цветом 93.
biggest-maximal-cliques
- nw
- biggest-maximal-cliques
- The biggest maximal cliques are, as the name implies, the biggest cliques in the current context. Often, more than one clique are tied for the title of biggest clique, so the result if reported as a list of agentsets, in random order. If you want only one clique, use one-of nw:biggest-maximal-cliques.
Получено по команде
foreach nw:biggest-maximal-cliques [ask ? [bank_color] ]
Далее мы удаляем всех остальных участников и показываем клики
Мосты (Bridges)
Мост — ребро в теории графов, удаление которого увеличивает число компонент связности. Такие рёбра также известны как разрезающие рёбра, разрезающие дуги или перешейки. Эквивалентное определение — ребро является мостом в том и только в том случае, если оно не содержится ни в одном цикле. Узел соединяющий отдельные части сети называется мостом. Удаление моста разрывает структуру и приводит к росту отдельных узлов. Поиск узлов помогает в понимании наиболее важных отношений и независимых групп.
Анализ социальных сетей в Интернете
- Анализ социальных сетей в интернете - Берни Хоган
- Hogan, B., Carrasco, J., & Wellman, B. (2007). Visualizing personal networks: Working with participant aided sociograms. Field Methods, 19(2), 116-144.
Литература
- Коулман Дж. Капитал социальный и человеческий // Общественные науки и современность. – 2001. - № 3. – С. 121 – 139.
- Freeman L.C., White D.R., Romney A.K. Research methods in social network analysis. Transaction Publishers, 1992. 544 с.
- Wenger E., McDermott R.A., Snyder W. Cultivating Communities of Practice: A Guide to Managing Knowledge. : Harvard Business Press, 2002. 306 с.
e-social science
Применение социального сетевого анализа
см. Сеть и работы Барабаши
- Назарчук А.В. О сетевых исследованиях в социальных науках // Социологические исследования. 2011. № 1. С. 39 – 51.
- Newman M.E.J., Watts D.J. The structure and dynamics of networks. : Princeton University Press, 2006. 596 с.
- Barabási A.-L. The network takeover // Nat Phys. 2012. Т. 8. № 1. С. 14–16.
SNA & Education
Analysts in this field have established Social Network Analysis (SNA) as an empirical method to study such social networks and the ties between actors in the network. In recent years, research has been carried out to test and demonstrate the applicability of SNA concepts in online community-based learning environments (Preece, 2000; Wellman, 1997). “Social network analysis (SNA) is the study of social relationships between a set of actors. SNA uses various concepts to evaluate different network properties like centrality, connectivity, and cliques etc, each of which pertain to particular dimensions of the network.” (Rajasekaran & Zaphiris, 2003).
As a method for examining interactions, connectedness and information sharing, SNA has commonly been used in sociology and organizational studies, however, there is a growing interest in applying it to the field of education and online learning (de Laat et al, 2004). Even in the academic settings, SNA is primarily used within faculty settings to determine information sharing patterns and social capital networks.
Литература
- Mika P. Social Networks and the Semantic Web (Semantic Web and Beyond), Springer, 2007, English ISBN: 9780387710006, pp. 234
- Teten D., Allen S. The Virtual Handshake: Opening Doors and Closing Deals Online
- А.Прохоров, Н.Ларичев Компьютерная визуализация социальных сетей
- Borgatti S.P. Identifying sets of key players in a network. // Computational, Mathematical and Organizational Theory. 2006. Т. 12. № 1. С. 21 – 34.
- Borgatti S.P., Foster P. The network paradigm in organizational research: A review and typology. // Journal of Management. 2003. Т. 29. № 6. С. 991 – 1013.
- Лифинцев Д.В. Оценка связей индивида в микросоциуме на основе методов анализа социальных сетей // Вестник Балтийского федерального Университета им. И. Канта. 2013. № 5. С. 77–84.
- Barabási A.-L. The network takeover // Nat Phys. 2012. Т. 8. № 1. С. 14–16.