Michal Kosmulski napisał(a):
Mój błąd. Problem objawiał się wtedy gdy ostatni wpis
na stronie
zawierał tylko link (bez opisu tekstowego po myślniku) a po nim nie
występował pusty wiersz. Poprawiłem i od zmieniły się statystyki:
25521 disambig-status
2083 disambig-status--
361 disambig-status---
1516 disambig-status----
254 disambig-status-!
21307 disambig-status-+
Ha, i od razu z 0,754428 dobrych linków się zrobiło
0,834881078. =}
Głównie kosztem 2-, które zmalało o połowę. Moim zdaniem ten wynik
potwierdza, że metoda ręcznych poprawek stylu disambigów jest dobra, bo
prosta i czytelna dla ludzi, a jakiejkolwiek poprawki, nawet trywialnej,
wymaga niecałe 17% haseł. Nieźle jak na stan surowy.
Ale do roboty: kolejny rodzaj to !, gdzie chyba wpadły disambigi, które
mają sekcje -- inne niż "Zobacz też". Wydaje mi się, że parser powinien
je po prostu pomijać, bo służą tylko zwiększeniu czytelności w hasłach
dotyczących bardzo popularnych nazw, a linki są robione zwykle
porządnie. Zatrzymywać się powinien tylko po znalezieniu specjalnej
sekcji "Zobacz też". Na razie ! to mały zbiorek, ale z czasem disambigi
zacznie puchnąć i zastosowanie sekcji będzie naturalnym odruchem.
No i ostatni zbiór problemowych disambigów na tej liście, też niewielki,
3-. Tu w zasadzie też tylko problem z sekcjami jest regularny, reszta to
np. przecinki do zamiany na myślniki i inne takie.
Właściwie do dokładniejszej analizy pozostają tylko dwie sprawy:
* listy wielostopniowe/zagnieżdżone (pewne elementy listy składają się z
dodatkowego wypunktowania)
* konstrukcje typu "[[coś]] (ewentualny nawias) w/przy/na/nad/koło/...
ewentualnie_jakieś [[miejsce]]"
bo zdaje się będą generować stosunkowo dużo pominięć tego parsera, a
mogą się pojawiać także w przyszłości. W tym drugim przypadku mieszczą
się te liczne hrabstwa i jeśli przyjmiesz regułę, że takie wyrażenia z
"w/..." są OK, to nawet nie będzie trzeba kłopotać bota o wstawianie
myślników do tych disambigów.
Myślę, że po załatwieniu problemów z pomijaniem sekcji i ewentualnie
kwestii wyrażeń z "w/..." można będzie się brać za ręczne poprawki.
P.S.: jeśli nikogo więcej nie interesują szczegóły i nie planuje się
przyłączyć do analizy ani poprawiania disambigów, to możemy przejść na
priva. Za jakiś czas podalibyśmy tylko efekty na listę albo na tablicę
ogłoszeń.
--
Kto powiedział "kasjer dupa"?!