Michal Kosmulski napisał(a):
Mój błąd. Problem objawiał się wtedy gdy ostatni wpis na stronie zawierał tylko link (bez opisu tekstowego po myślniku) a po nim nie występował pusty wiersz. Poprawiłem i od zmieniły się statystyki: 25521 disambig-status 2083 disambig-status-- 361 disambig-status--- 1516 disambig-status---- 254 disambig-status-! 21307 disambig-status-+
Ha, i od razu z 0,754428 dobrych linków się zrobiło 0,834881078. =} Głównie kosztem 2-, które zmalało o połowę. Moim zdaniem ten wynik potwierdza, że metoda ręcznych poprawek stylu disambigów jest dobra, bo prosta i czytelna dla ludzi, a jakiejkolwiek poprawki, nawet trywialnej, wymaga niecałe 17% haseł. Nieźle jak na stan surowy.
Ale do roboty: kolejny rodzaj to !, gdzie chyba wpadły disambigi, które mają sekcje -- inne niż "Zobacz też". Wydaje mi się, że parser powinien je po prostu pomijać, bo służą tylko zwiększeniu czytelności w hasłach dotyczących bardzo popularnych nazw, a linki są robione zwykle porządnie. Zatrzymywać się powinien tylko po znalezieniu specjalnej sekcji "Zobacz też". Na razie ! to mały zbiorek, ale z czasem disambigi zacznie puchnąć i zastosowanie sekcji będzie naturalnym odruchem.
No i ostatni zbiór problemowych disambigów na tej liście, też niewielki, 3-. Tu w zasadzie też tylko problem z sekcjami jest regularny, reszta to np. przecinki do zamiany na myślniki i inne takie.
Właściwie do dokładniejszej analizy pozostają tylko dwie sprawy: * listy wielostopniowe/zagnieżdżone (pewne elementy listy składają się z dodatkowego wypunktowania) * konstrukcje typu "[[coś]] (ewentualny nawias) w/przy/na/nad/koło/... ewentualnie_jakieś [[miejsce]]"
bo zdaje się będą generować stosunkowo dużo pominięć tego parsera, a mogą się pojawiać także w przyszłości. W tym drugim przypadku mieszczą się te liczne hrabstwa i jeśli przyjmiesz regułę, że takie wyrażenia z "w/..." są OK, to nawet nie będzie trzeba kłopotać bota o wstawianie myślników do tych disambigów.
Myślę, że po załatwieniu problemów z pomijaniem sekcji i ewentualnie kwestii wyrażeń z "w/..." można będzie się brać za ręczne poprawki.
P.S.: jeśli nikogo więcej nie interesują szczegóły i nie planuje się przyłączyć do analizy ani poprawiania disambigów, to możemy przejść na priva. Za jakiś czas podalibyśmy tylko efekty na listę albo na tablicę ogłoszeń.