Процедура извлечения редакторов вики-страницы
Материал из Letopisi.Ru — «Время вернуться домой»
(Различия между версиями)
(→Извлечение редакторов статьи) |
(→Извлечение названий страниц) |
||
Строка 4: | Строка 4: | ||
* Главная страница (772 219 просмотров) | * Главная страница (772 219 просмотров) | ||
* Текущие события (76 297 просмотров) | * Текущие события (76 297 просмотров) | ||
+ | |||
+ | Решение: | ||
+ | open (DATA,"pages.txt") || die ; | ||
+ | while (<DATA>) { | ||
+ | chomp ; | ||
+ | s/\S\(\d.*$// ; | ||
+ | print "$_\n" | ||
+ | } | ||
Надо, чтобы оставалось только: | Надо, чтобы оставалось только: |
Версия 08:06, 26 марта 2010
Извлечение названий страниц
Строки
- Главная страница (772 219 просмотров)
- Текущие события (76 297 просмотров)
Решение:
open (DATA,"pages.txt") || die ; while (<DATA>) { chomp ; s/\S\(\d.*$// ; print "$_\n" }
Надо, чтобы оставалось только:
- Главная страница
- Текущие события
Извлечение редакторов статьи
- (текущ.) (пред.) 22:11, 13 марта 2010 Тимохина Евгения (Обсуждение | вклад | заблокировать) (10 636 байт) (отменить)
Из этого нужно оставить только имя участника (то, что после четырехзначной даты + пробел) и до пробел (Обсуждение
- Потом подсчитать сколько раз встречается это имя в строке