Процедура извлечения редакторов вики-страницы
Материал из Letopisi.Ru — «Время вернуться домой»
Версия от 09:57, 8 апреля 2010; Евгений Патаракин (обсуждение | вклад)
Веб интерфейс для построения графа соредактирования
- http://www.uic.unn.ru/pustyn/cgi-bin/graph.html
- Здесь можно просто загрузить данные и получить готовый граф.
Извлечение названий страниц
Строки
- Главная страница (772 219 просмотров)
- Текущие события (76 297 просмотров)
#!/usr/bin/perl open (DATA,"pages.txt") || die ; while (<DATA>) { s/\s+\S+\(\d.*$// ; chomp ; print "\"$_\"\;\n" ; }
Надо, чтобы оставалось только:
- Главная страница
- Текущие события
Извлечение редакторов статьи
- (текущ.) (пред.) 22:11, 13 марта 2010 Имя Фамилия (Обсуждение | вклад | заблокировать) (10 636 байт) (отменить)
Из этого нужно оставить только Имя Фамилия (то, что после четырехзначной даты + пробел) и до пробел (Обсуждение
- Потом подсчитать сколько раз встречается это имя в строке
while (<DATA>) { s/\s+\(Обсуждение\s+.*$// ; s/^\(.*\d\d\d\d\s+//; chomp ; $editors{$_}++ ; foreach $e (values %editors) { $tmp = $tmp + $e ; } foreach $person (sort keys %editors) { $width = ceil (10 * $editors{$person} / $tmp) ; print "\"User:$person\" -> \"PageName\" [penwidth=$width label=\"$editors{$person}\"] ;\n"; }
}
Необходимо сделать доступным скрипт, который бы позволял участникам помещать в форму историю страницы и получать готовый к размещению граф.