[Wikipl-l] Propozycja zmian w szablonach
Daniel Koć
kocio w linuxnews.pl
Czw, 17 Maj 2007, 13:51:23 UTC
Michal Kosmulski napisał(a):
> podmieniłem listę artykułów. Po uwzględnieniu tej zmiany, statystyki
> wyglądają nastepująco:
> 25521 disambig-status
> 4214 disambig-status--
> 388 disambig-status---
> 1566 disambig-status----
> 254 disambig-status-!
> 19099 disambig-status-+
>
> 0,754428 dobrych linków
>
Popatrzyłem pobieżnie na listę najcięższych przypadków (---) i znalazłem
trzy większe grupy:
1. Hrabstwo xxx (421)
Schemat chyba wrzucany z bota:
*hrabstwo xxx (ang. xxx County) w USA, w stanie yyy
wystarczy więc pewnie botem przejechać, żeby były myślniki, np w formie:
*hrabstwo xxx (ang. xxx County) - hrabstwo w USA, w stanie yyy
2. Synagoga xxx w yyy (30)
To chyba też botem można naprawić z:
*Synagoga xxx w yyy przy ulicy zzz
na:
*Synagoga xxx w yyy - przy ulicy zzz
3. USS xxx (260) i HMS xxx (14)
Jak to powinno się naprawiać? Bo widzę, że są różne style definiowania:
* przecinki zamiast myślników
* słowo "był" albo "nosił nazwę"
* wyliczanki "pierwszy xxx, drugi xxx"
(http://pl.wikipedia.org/wiki/USS_Massachusetts)
Czy dla parsera problemem są opisy w postaci tekstu z linkami przed listą?
--
Kto powiedział "kasjer dupa"?!
Więcej informacji o liście dyskusyjnej WikiPL-l