Процедура извлечения редакторов вики-страницы
Материал из Letopisi.Ru — «Время вернуться домой»
(Различия между версиями)
(→Извлечение редакторов статьи) |
|||
(не показаны 9 промежуточных версий 1 участника) | |||
Строка 1: | Строка 1: | ||
+ | Статья утратила актуальность и имеет только историческую ценность. В Летописи действует инструмент [[викиграмма]] | ||
+ | |||
+ | === Веб интерфейс для построения графа соредактирования === | ||
+ | ; http://www.uic.unn.ru/pustyn/cgi-bin/graph.html | ||
+ | : Здесь можно просто загрузить данные и получить готовый граф. | ||
=== Извлечение названий страниц === | === Извлечение названий страниц === | ||
Строка 4: | Строка 9: | ||
* Главная страница (772 219 просмотров) | * Главная страница (772 219 просмотров) | ||
* Текущие события (76 297 просмотров) | * Текущие события (76 297 просмотров) | ||
+ | |||
+ | #!/usr/bin/perl | ||
+ | open (DATA,"pages.txt") || die ; | ||
+ | while (<DATA>) { | ||
+ | s/\s+\S+\(\d.*$// ; | ||
+ | chomp ; | ||
+ | print "\"$_\"\;\n" ; | ||
+ | } | ||
Надо, чтобы оставалось только: | Надо, чтобы оставалось только: | ||
Строка 10: | Строка 23: | ||
=== Извлечение редакторов статьи === | === Извлечение редакторов статьи === | ||
− | * (текущ.) (пред.) 22:11, 13 марта 2010 | + | * (текущ.) (пред.) 22:11, 13 марта 2010 Имя Фамилия (Обсуждение | вклад | заблокировать) (10 636 байт) (отменить) |
− | Из этого нужно оставить только ''' | + | Из этого нужно оставить только '''Имя Фамилия''' (то, что после четырехзначной даты + пробел) и до пробел (Обсуждение |
:: Потом подсчитать сколько раз встречается это имя в строке | :: Потом подсчитать сколько раз встречается это имя в строке | ||
+ | |||
+ | while (<DATA>) { | ||
+ | s/\s+\(Обсуждение\s+.*$// ; | ||
+ | s/^\(.*\d\d\d\d\s+//; | ||
+ | chomp ; | ||
+ | $editors{$_}++ ; | ||
+ | |||
+ | foreach $e (values %editors) { | ||
+ | $tmp = $tmp + $e ; | ||
+ | } | ||
+ | foreach $person (sort keys %editors) { | ||
+ | $width = ceil (10 * $editors{$person} / $tmp) ; | ||
+ | print "\"User:$person\" -> \"PageName\" [penwidth=$width label=\"$editors{$person}\"] ;\n"; | ||
+ | } | ||
+ | |||
+ | } | ||
+ | |||
+ | |||
+ | Необходимо сделать доступным скрипт, который бы позволял участникам помещать в форму историю страницы и получать готовый к размещению [[граф]]. | ||
[[Категория:Исследование]] | [[Категория:Исследование]] | ||
+ | [[Категория:Учебная аналитика]] |
Текущая версия на 10:32, 17 марта 2018
Статья утратила актуальность и имеет только историческую ценность. В Летописи действует инструмент викиграмма
[править] Веб интерфейс для построения графа соредактирования
- http://www.uic.unn.ru/pustyn/cgi-bin/graph.html
- Здесь можно просто загрузить данные и получить готовый граф.
[править] Извлечение названий страниц
Строки
- Главная страница (772 219 просмотров)
- Текущие события (76 297 просмотров)
#!/usr/bin/perl open (DATA,"pages.txt") || die ; while (<DATA>) { s/\s+\S+\(\d.*$// ; chomp ; print "\"$_\"\;\n" ; }
Надо, чтобы оставалось только:
- Главная страница
- Текущие события
[править] Извлечение редакторов статьи
- (текущ.) (пред.) 22:11, 13 марта 2010 Имя Фамилия (Обсуждение | вклад | заблокировать) (10 636 байт) (отменить)
Из этого нужно оставить только Имя Фамилия (то, что после четырехзначной даты + пробел) и до пробел (Обсуждение
- Потом подсчитать сколько раз встречается это имя в строке
while (<DATA>) { s/\s+\(Обсуждение\s+.*$// ; s/^\(.*\d\d\d\d\s+//; chomp ; $editors{$_}++ ; foreach $e (values %editors) { $tmp = $tmp + $e ; } foreach $person (sort keys %editors) { $width = ceil (10 * $editors{$person} / $tmp) ; print "\"User:$person\" -> \"PageName\" [penwidth=$width label=\"$editors{$person}\"] ;\n"; }
}
Необходимо сделать доступным скрипт, который бы позволял участникам помещать в форму историю страницы и получать готовый к размещению граф.