1. Tworzenie pustego szablonu chyba nie ma sensu, bo
jego dołączanie
tylko niepotrzebnie obciąży serwery. Jeśli już to proponuje użyć
komentarza.
Racja, nie pomyślałem o tym.
2. Jeśli w disambigu występuje linia
*[[xxx]] - bla [[bla]] bla
to możesz być praktycznie pewny, że chodzi o xxx, a nie bla. Pewność
jest na pewno większa niż w przypadku redirectów. zresztą jeśli
wyszukiwarka popełni tu błąd w przypadku dajmy 0,5% przypadków, to nie
jest to chyba duży problem.
Przejrzałem trochę stron ujednoznaczniających i
rzeczywiście w tej
chwili sporo stron stosuje się do wymienionego wyżej schematu. Kiedy
robiłem pierwsze podejście do interpretacji stron ujednoznaczniających
przez program, odniosłem wrażenie, że ich format jest raczej swobodny i
wypróbowawszy kilka heurystyk, stwierdziłem, że wszystkie dawały zbyt
wiele fałszywych synonimów. Wygląda, że od tamtego czasu sporo się
zmieniło na plus.
Mogę sobie wyobrazić wpis, w którym przypadkowo będzie użyty taki format
wiersza, ale pierwszy link nie będzie prowadził do ujednoznacznienia,
np. ktoś mógłby napisać:
Słowo "wilk" może oznaczać:
*[[zwierzę]] - drapieżnego [[ssak]]a
ale chyba będzie to raczej wyjątek.
Jeśli dałoby się uczynić ze wspomnianego formatu oficalne zalecenie
edycyjne, to myślę, że mój problem byłby w znacznej mierze rozwiązany
(może pojawią się jakieś niespodziewane wyjątki od tej reguły, ale w tym
momencie liczę że nie będzie ich zbyt wiele). Chodzi o to, żeby nie było
tak, że ktoś zmieni stronę aby używała nowego formatu, a ktoś inny ją
przeformatuje w inny sposób, bo tak będzie jego zdaniem lepiej
wyglądało. Jeśli format będzie oficjalnym zaleceniem, takie sytuacje nie
powinny już mieć miejsca, a gdyby miały, to zalecenie edycyjne będzie
poważnym argumentem za przywróceniem "oficjalnego" sposobu formatowania.
3. Ręczne sprawdzanie listy to mniej pracy, niż
poprawienie disambigów.
Nie do końca rozumiem, o sprawdzenie której listy chodzi?
4. Może po prostu ręcznie sprawdzać i poprawiać
wszystkie disambigi, a
zaraz zgłaszać do przeskanowania przez bota? Żeby to uaktualniać
Ważne byłoby dla
mnie to, aby nie było wpisów pasujących do ustalonego
formatu, ale zawierających w pierwszym linku "niewłaściwą" stronę. Jeśli
jakieś strony używałyby innego formatu (bo jeszcze nie zostały
sprawdzone), to nie byłoby to problemem - bot po prostu ignorowałby je.
Więc jeśli chodzi o moje potrzeby, to nie ma konieczności sprawdzania od
razu wszystkich disambigów (choć oczywiście taka akcja na pewno byłaby
bardzo pomocna), możnaby to sprawdzanie rozłożyć w czasie (a nawet bez
sprawdzania mechanizm powinien działać przyzwoicie).
5. Tak dla ścisłości. Chcecie wykorzystywać to przy
wyświetlaniu
materiałów z wikipedii, czy poszukiwanych stron?
Przy przeszukiwaniu Wikipedii.
Zmieniając po raz kolejny strategię proponuję zatem:
1. Na razie dać sobie spokój z szablonami i innymi markerami. Jeśli
okaże się, że samo sprawdzanie ujednoznacznień pasujących do ustalonego
formatu to za mało, najwyżej za jakiś czas ponownie wrócę do tematu.
2. Dopracować szczegółowo zalecenia edycyjne ze strony
http://pl.wikipedia.org/wiki/Wikipedysta:Witek1988/brudnopis i jeśli
będzie co do nich zgoda, na umieszczenie ich na
http://pl.wikipedia.org/wiki/Wikipedia:Strony_ujednoznaczniaj%C4%85ce
jako oficjalnego zalecenia dla tworzących strony ujednoznaczniające.
Prawdopodobnie trzeba by też dopuścić oprócz formatu
*[[podobna nazwa]] - krótka definicja
również dodatkowo
*[[podobna nazwa]] (wyjaśnienie) - krótka definicja
bo taki format wydaje się być używany na sporej liczbie stron, np. w
taki sposób:
* [[hrabstwo DeKalb (Alabama)|hrabstwo DeKalb]] ([[Język
angielski|ang.]] ''DeKalb County'') – w stanie [[Alabama]]
i przenoszenie nazwy oryginalnej za myślnik źle by wyglądało.
Pozdrawiam,
Michał
--
Michał Kosmulski (mkosmul)
http://www.netsprint.pl/
http://hektor.umcs.lublin.pl/~mikosmul/