Процедура извлечения редакторов вики-страницы

Материал из Letopisi.Ru — «Время вернуться домой»
(Различия между версиями)
Перейти к: навигация, поиск
(Извлечение названий страниц)
 
(не показаны 8 промежуточных версий 1 участника)
Строка 1: Строка 1:
 +
Статья утратила актуальность и имеет только историческую ценность. В Летописи действует инструмент [[викиграмма]]
 +
 +
=== Веб интерфейс для построения графа соредактирования ===
 +
; http://www.uic.unn.ru/pustyn/cgi-bin/graph.html
 +
: Здесь можно просто загрузить данные и получить готовый граф.
  
 
=== Извлечение названий страниц ===
 
=== Извлечение названий страниц ===
Строка 5: Строка 10:
 
* Текущие события ‎(76 297 просмотров)
 
* Текущие события ‎(76 297 просмотров)
  
Решение:
+
#!/usr/bin/perl
 
  open (DATA,"pages.txt") || die ;
 
  open (DATA,"pages.txt") || die ;
 
  while (<DATA>) {
 
  while (<DATA>) {
 +
s/\s+\S+\(\d.*$// ;
 
  chomp ;
 
  chomp ;
s/\S\(\d.*$// ;
+
  print "\"$_\"\;\n" ;
  print "$_\n"
+
 
  }
 
  }
  
Строка 18: Строка 23:
  
 
=== Извлечение редакторов статьи ===
 
=== Извлечение редакторов статьи ===
* (текущ.) (пред.)  22:11, 13 марта 2010 Тимохина Евгения (Обсуждение | вклад | заблокировать) (10 636 байт) (отменить)
+
* (текущ.) (пред.)  22:11, 13 марта 2010 Имя Фамилия (Обсуждение | вклад | заблокировать) (10 636 байт) (отменить)
  
Из этого нужно оставить только '''имя участника''' (то, что после четырехзначной даты + пробел) и до пробел (Обсуждение
+
Из этого нужно оставить только '''Имя Фамилия''' (то, что после четырехзначной даты + пробел) и до пробел (Обсуждение
 
:: Потом подсчитать сколько раз встречается это имя в строке
 
:: Потом подсчитать сколько раз встречается это имя в строке
 +
 +
while (<DATA>) {
 +
s/\s+\(Обсуждение\s+.*$// ;
 +
s/^\(.*\d\d\d\d\s+//;
 +
chomp ;
 +
$editors{$_}++ ;
 +
 +
foreach $e (values %editors) {
 +
$tmp = $tmp + $e ;
 +
}
 +
foreach $person (sort keys %editors) {
 +
$width = ceil (10 * $editors{$person} / $tmp) ;
 +
print "\"User:$person\" -> \"PageName\" [penwidth=$width label=\"$editors{$person}\"]  ;\n";
 +
}
 +
 +
}
 +
 +
 +
Необходимо сделать доступным скрипт, который бы позволял участникам помещать в форму историю страницы и получать готовый к размещению [[граф]].
  
 
[[Категория:Исследование]]
 
[[Категория:Исследование]]
 +
[[Категория:Учебная аналитика]]

Текущая версия на 10:32, 17 марта 2018

Статья утратила актуальность и имеет только историческую ценность. В Летописи действует инструмент викиграмма

[править] Веб интерфейс для построения графа соредактирования

http://www.uic.unn.ru/pustyn/cgi-bin/graph.html
Здесь можно просто загрузить данные и получить готовый граф.

[править] Извлечение названий страниц

Строки

  • Главная страница ‎(772 219 просмотров)
  • Текущие события ‎(76 297 просмотров)
#!/usr/bin/perl
open (DATA,"pages.txt") || die ;
while (<DATA>) {
s/\s+\S+\(\d.*$// ;
chomp ;
print "\"$_\"\;\n" ;
}

Надо, чтобы оставалось только:

  • Главная страница
  • Текущие события

[править] Извлечение редакторов статьи

  • (текущ.) (пред.) 22:11, 13 марта 2010 Имя Фамилия (Обсуждение | вклад | заблокировать) (10 636 байт) (отменить)

Из этого нужно оставить только Имя Фамилия (то, что после четырехзначной даты + пробел) и до пробел (Обсуждение

Потом подсчитать сколько раз встречается это имя в строке
while (<DATA>) {
s/\s+\(Обсуждение\s+.*$// ;
s/^\(.*\d\d\d\d\s+//;
chomp ;
$editors{$_}++ ;

foreach $e (values %editors) {
$tmp = $tmp + $e ; 
}
foreach $person (sort keys %editors) {
$width = ceil (10 * $editors{$person} / $tmp) ;
print "\"User:$person\" -> \"PageName\" [penwidth=$width label=\"$editors{$person}\"]  ;\n";
}
}


Необходимо сделать доступным скрипт, который бы позволял участникам помещать в форму историю страницы и получать готовый к размещению граф.

Персональные инструменты
Инструменты