Анализ социальных сетей/Ключевые понятия

Материал из Letopisi.Ru — «Время вернуться домой»
Перейти к: навигация, поиск

Содержание

Общие понятия

  • Вероятность связывания новых узлов к существующим узлам определяется тем, сколько узлов уже связаны с данным узлом. Другими словами, богатые узлы становятся богаче.
  • В большинстве реальных сетей тесно связанные группы связаны между собой через мосты.
  • Личные сети. Сети друзей-друзей-друзей - Непотизм - семейственность.
  • Социальный капитал. Комбинация индивидуальных и сетевых ресурсов актора с нормами и правилами, действующими в данной социальной сети, образует его «сетевой капитал». В упрощенном виде «сетевой капитал» можно рассматривать как сумму некоторых преимуществ, которые актор может получить в произвольный момент времени для достижения некоторой цели. Бурдье определял социальный капитал как “ресурсы, основанные на родственных отношениях и отношениях в группе членства”. Коулмен использовал концепцию в более широком аспекте, включая в нее обязательства и ожидания, информационные каналы и социальные нормы. Для Коулмана - Сетевой капитал ресурс, перемещающийся от доноров к реципиентам

Традиционно для обозначения отдельного элемента социальной сети используют понятие «узел», если речь идет об исследованиях прикладного математического характера, или «актор», если подразумевается социологические исследования. В целом узел и актор по сути представляет собой отдельного человека (в социальных сетях), выступающего субъектом связей с другими индивидами.

Сетевые метрики

Показатели, которые используются при анализе социальных сетей.

Плотность

Плотность – это отношение числа имеющихся рёбер графа к максимально возможному количеству рёбер данного графа. Плотность – распространённая метрика, она используется в первую очередь при сравнении графов одного размера, или при сравнении графа с самим собой во времени.

Коэффициент кластеризации

Коэффициент кластеризации – это метрика, которая является более эффективной, чем плотность, и её всё чаще используют в общественных науках. Коэффициент локального объединения в кластеры (коэффициент кластеризации) является мерой того, насколько хорошо связанны ноды с конкретным узлом. Коэффициент кластеризации – это значения кластеризации для всех узлов графа. Когда коэффициент кластеризации высокий – это означает, что граф чрезвычайно плотно сгруппирован вокруг нескольких узлов; когда он низкий – это значит, что связи в графе относительно равномерно распространены среди всех узлов.

Degree

Количество узлов, связанных с данным узлом - степень данного узла.

Близость - Closeness

Мера скорости передачи информации. Как долго будет происходить передача информации от данного узла к другим связанным узлам. Инверсия суммы кратчайших расстояний между каждым узлом и каждым другим узлом в сети. Близость показывает, насколько просто одному узлу связаться с другим узлом. Чем меньше узлов-посредников между текущем узлом и другими узлами, тем ниже показатель близости и выше степень близости.Если узел централен, то он может быстро взаимодействовать с другими узлами.

Центральность (Близость к центру)

Для анализа связей в социальной сети используют различные индивидуальные и групповые показатели, позволяющие оценить степень заметности и влияния акторов друг на друга. Собственно идея центральности вершин в графе, их значения появилась одной из первых в методологии анализа социальных сетей, и напрямую может быть увязана с первыми попытками Дж. Морено выявить самых популярных участников в группе («социометрических звезд»). Позднее эта мера заметности актора в сети стала называться центральностью.

Близость к центру или Степень центральности (Degree centrality) – показывает, кто является наиболее активным узлом в сети. Измеряется количеством связей с другими узлами в сети. Центральность показывает, насколько данный узел близок по отношению к другим узлам в сети. В соответствие с теорией сетей большое количество взаимодействий узла может не только изменить позицию узла в сети, но также и изменить позиции других узлов.

  • Престиж узла: входная степень узла (in-degree) — количество ребер графа, входящих в узел.
  • Влияние узла: выходная степень узла (out-degree) — количество ребер графа, исходящих из узла. Эта характеристика показывает, кто является наиболее активным в сети. Индивидуальный показатель близости к центру показывает, в какой степени узел связан остальными узлами, то есть насколько тесно он связан с группой.
  • Freeman L.C. Centrality in social networks: Conceptual clarification // Social Networks. 1979. Т. 1. № 3. С. 215–239.

Мера центральности описывает выдающееся положение конкретного узла по сравнению с другими узлами. Средняя мера центральности также известна как централизованная оценка и указывает, насколько плотен граф по отношению к каждому узлу. Есть три показателя центральности: центральность по степени, центральность по близости и центральность по посредничеству.

Центральность по степени

Смысл этой меры основан на допущении, что тот, кто обладает большим количеством связей (отношений) с другими, занимает центральное положение в локальной общности.

Центральность по степени – это отношение количества связей определённого узла к общему количеству других узлов. В случае направленной сети существует две отдельных меры ЦС: входящая (indegree) и исходящая (outdegree). Входящая указывает число связей, направленных к узлу, а исходящая – число связей, направленных от узла. Если ЦС = 1, это указывает на то, что определённый узел связан со всеми остальными узлами сети, в то время как ЦС = 0 указывает на то, что узел изолирован. Так как многие интернет-сети являются направленными, есть определённый смысл в том, чтобы использовать входящую и исходящую центральность по степени. Высокая исходящая центральность по степени указывает на то, что узел является «властным»; это такой тип человека или сайта, который может быстро распространить информацию среди других людей. Высокая входящая центральность по степени указывает, что узел – «знаменитость»; это значит, что за таким типом человека или сайта будет следить много людей. Google.com имеет миллиарды внешних ссылок на другие сайты. Это – власть. YouTube.com имеет относительно немного ссылок на другие сайты, однако, много людей размещают ссылки на YouTube или встраивают его контент на собственные страницы. Это – известность.

Недостатком такой меры является то, что количество социальных контактов зачастую не отражает их качества, а просто свидетельствует о степени общительности индивида.

Центральность по близости closeness-centrality =

Центральность по близости выражает, насколько близко узел расположен к остальным узлам сети. По мнению Фримана, это мера эффективности, так как узел, который является наиболее близким к остальным узлам графа, лучше всех подвержен восприятию новой информации или вируса. Формально центральность по близости выражается как отношение числа других узлов графа к сумме расстояний между определённым узлом и всеми другими. Если БЦ = 1, это означает, что определённый узел связан со всеми другими узлами. Вероятно, что сайты СМИ, которые имеют блог-платформы, такие как Gizmodo.com и DailyKOS.com имеют очень высокий показатель БЦ. Они содержат ссылки на большое количество других сайтов, и многие другие сайты, в свою очередь, ссылаются на них.

Центральность по близости (Closeness centrality) является показателем того, насколько быстро распространяется информация в сети от одного участника к остальным, то есть насколько близок рассматриваемый участник ко всем остальным участникам сети.

Показатель «центральность по близости» (closeness centrality) демонстрирует, насколько легко достичь определенного узла в сети. Если говорить о футболе, то этот показатель позволяет судить, как этот игрок взаимодействует с командой.

The closeness centrality of a turtle is defined as the inverse of the average of it's distances to all other turtles. - Обратное среднему от расстояний до всех других черепах.

см. https://github.com/NetLogo/NW-Extension - Сетевое расширение NetLogo - и отдельный раздел о измерении центральности

Центральность по посредничеству betweenness-centrality

См. http://en.wikipedia.org/wiki/Betweenness_centrality

b30e5d1ded3e018f8ed080b9b09876e9.png

ask turtles [ set size nw:betweenness-centrality ] - черепахи устанавливают размер = степени

Важное - вес связи - у связи может быть вес и вес связи может увеличиваться (например, с течением времени вес связи между автором и документом может уменьшаться)

links-own [ weight ]- у связи может быть такое понятие как вес
ask turtle 0 [ create-link-with turtle 1 [ set weight 2.0 ] ]


  • To calculate the betweenness centrality of a turtle, you take every other possible pairs of turtles and, for each pair, you calculate the proportion of shortest paths between members of the pair that passes through the current turtle. The betweeness centrality of a turtle is the sum of these.

Для вычисление центральности по посредничеству данной черепахи берутся все возможные пары других черепах и для каждой пары вычисляется доля кратчайших путей между этими черепахами, которые бы проходили через данную черепаху. Сумма этих долей и составляет центральность по посредничеству для данной черепахи.

Центральность по посредничеству выражает, сколько кратчайших путей между всеми нодами сети проходит через определённый узел. Центральность по посредничеству – это мера контроля. Если у какого-либо узла высокий показатель ЦП, можно предположить, что он – единственная связь между различными частями сети.

Центральность по посредничеству (betweenness centrality) — характеризует, насколько важную роль данный узел играет на пути между другими узлами. При анализе футбольного матча центральность по посредничеству позволяет судить, насколько работа с мячом между двумя игроками зависит от третьего игрока. Игроки с высоким уровнем центральности по посредничеству играют ключевые роли в поддержании темпа игры. См. http://blogerator.ru/page/algoritm-pagerank-pozvoljaet-analizirovat-igrovuju-strategiju-futbolnyh-komand-teorija-setej

eigenvector-centrality

turtle.gif

nw:eigenvector-centrality

Центральность по собственному вектору (Eigenvector centrality) демонстрирует зависимость между центральностью участника и центральностями его друзей.

The Eigenvector centrality of a node can be thought of as the amount of influence a node has on a network. In practice, turtles that are connected to a lot of other turtles that are themselves well-connected (and so on) get a higher Eigenvector centrality score.

Черепаха, которая имеет много связей с теми, у кого тоже много связей, имеет высокую центральность по собственному вектору.

page-rank
weighted-closeness-centrality

nw:weighted-closeness-centrality

Посредничество = Betweenness

Посредничество (Betweenness) – показывает, какое влияние оказывает узел для соединения разрывов между другими узлами в сети. Если сеть построена таким образом, что нет никаких других путей взаимодействия других узлов кроме как через этот узел, то он будет иметь максимальное влияние. Удаление узла с большим показателем посредничества повлечет за собой обрыв информационного потока и создаст фрагментацию сети.

Мосты (Bridges)

Узел соединяющий отдельные части сети называется мостом. Удаление моста разрывает структуру и приводит к росту отдельных узлов. Поиск узлов помогает в понимании наиболее важных отношений и независимых групп.

Анализ социальных сетей в Интернете

Литература

  • Коулман Дж. Капитал социальный и человеческий // Общественные науки и современность. – 2001. - № 3. – С. 121 – 139.
  • Freeman L.C., White D.R., Romney A.K. Research methods in social network analysis. Transaction Publishers, 1992. 544 с.
Персональные инструменты
Инструменты