Процедура извлечения редакторов вики-страницы

Материал из Letopisi.Ru — «Время вернуться домой»
Перейти к: навигация, поиск

Веб интерфейс для построения графа соредактирования

http://www.uic.unn.ru/pustyn/cgi-bin/graph.html
Здесь можно просто загрузить данные и получить готовый граф.

Извлечение названий страниц

Строки

  • Главная страница ‎(772 219 просмотров)
  • Текущие события ‎(76 297 просмотров)
#!/usr/bin/perl
open (DATA,"pages.txt") || die ;
while (<DATA>) {
s/\s+\S+\(\d.*$// ;
chomp ;
print "\"$_\"\;\n" ;
}

Надо, чтобы оставалось только:

  • Главная страница
  • Текущие события

Извлечение редакторов статьи

  • (текущ.) (пред.) 22:11, 13 марта 2010 Имя Фамилия (Обсуждение | вклад | заблокировать) (10 636 байт) (отменить)

Из этого нужно оставить только Имя Фамилия (то, что после четырехзначной даты + пробел) и до пробел (Обсуждение

Потом подсчитать сколько раз встречается это имя в строке
while (<DATA>) {
s/\s+\(Обсуждение\s+.*$// ;
s/^\(.*\d\d\d\d\s+//;
chomp ;
$editors{$_}++ ;

foreach $e (values %editors) {
$tmp = $tmp + $e ; 
}
foreach $person (sort keys %editors) {
$width = ceil (10 * $editors{$person} / $tmp) ;
print "\"User:$person\" -> \"PageName\" [penwidth=$width label=\"$editors{$person}\"]  ;\n";
}
}


Необходимо сделать доступным скрипт, который бы позволял участникам помещать в форму историю страницы и получать готовый к размещению граф.

Персональные инструменты
Инструменты