- Tworzenie pustego szablonu chyba nie ma sensu, bo jego dołączanie
tylko niepotrzebnie obciąży serwery. Jeśli już to proponuje użyć komentarza.
Racja, nie pomyślałem o tym.
- Jeśli w disambigu występuje linia
*[[xxx]] - bla [[bla]] bla to możesz być praktycznie pewny, że chodzi o xxx, a nie bla. Pewność jest na pewno większa niż w przypadku redirectów. zresztą jeśli wyszukiwarka popełni tu błąd w przypadku dajmy 0,5% przypadków, to nie jest to chyba duży problem.
Przejrzałem trochę stron ujednoznaczniających i rzeczywiście w tej chwili sporo stron stosuje się do wymienionego wyżej schematu. Kiedy robiłem pierwsze podejście do interpretacji stron ujednoznaczniających przez program, odniosłem wrażenie, że ich format jest raczej swobodny i wypróbowawszy kilka heurystyk, stwierdziłem, że wszystkie dawały zbyt wiele fałszywych synonimów. Wygląda, że od tamtego czasu sporo się zmieniło na plus. Mogę sobie wyobrazić wpis, w którym przypadkowo będzie użyty taki format wiersza, ale pierwszy link nie będzie prowadził do ujednoznacznienia, np. ktoś mógłby napisać:
Słowo "wilk" może oznaczać: *[[zwierzę]] - drapieżnego [[ssak]]a
ale chyba będzie to raczej wyjątek.
Jeśli dałoby się uczynić ze wspomnianego formatu oficalne zalecenie edycyjne, to myślę, że mój problem byłby w znacznej mierze rozwiązany (może pojawią się jakieś niespodziewane wyjątki od tej reguły, ale w tym momencie liczę że nie będzie ich zbyt wiele). Chodzi o to, żeby nie było tak, że ktoś zmieni stronę aby używała nowego formatu, a ktoś inny ją przeformatuje w inny sposób, bo tak będzie jego zdaniem lepiej wyglądało. Jeśli format będzie oficjalnym zaleceniem, takie sytuacje nie powinny już mieć miejsca, a gdyby miały, to zalecenie edycyjne będzie poważnym argumentem za przywróceniem "oficjalnego" sposobu formatowania.
- Ręczne sprawdzanie listy to mniej pracy, niż poprawienie disambigów.
Nie do końca rozumiem, o sprawdzenie której listy chodzi?
- Może po prostu ręcznie sprawdzać i poprawiać wszystkie disambigi, a
zaraz zgłaszać do przeskanowania przez bota? Żeby to uaktualniać
Ważne byłoby dla mnie to, aby nie było wpisów pasujących do ustalonego formatu, ale zawierających w pierwszym linku "niewłaściwą" stronę. Jeśli jakieś strony używałyby innego formatu (bo jeszcze nie zostały sprawdzone), to nie byłoby to problemem - bot po prostu ignorowałby je. Więc jeśli chodzi o moje potrzeby, to nie ma konieczności sprawdzania od razu wszystkich disambigów (choć oczywiście taka akcja na pewno byłaby bardzo pomocna), możnaby to sprawdzanie rozłożyć w czasie (a nawet bez sprawdzania mechanizm powinien działać przyzwoicie).
- Tak dla ścisłości. Chcecie wykorzystywać to przy wyświetlaniu
materiałów z wikipedii, czy poszukiwanych stron?
Przy przeszukiwaniu Wikipedii.
Zmieniając po raz kolejny strategię proponuję zatem:
1. Na razie dać sobie spokój z szablonami i innymi markerami. Jeśli okaże się, że samo sprawdzanie ujednoznacznień pasujących do ustalonego formatu to za mało, najwyżej za jakiś czas ponownie wrócę do tematu.
2. Dopracować szczegółowo zalecenia edycyjne ze strony http://pl.wikipedia.org/wiki/Wikipedysta:Witek1988/brudnopis i jeśli będzie co do nich zgoda, na umieszczenie ich na http://pl.wikipedia.org/wiki/Wikipedia:Strony_ujednoznaczniaj%C4%85ce jako oficjalnego zalecenia dla tworzących strony ujednoznaczniające.
Prawdopodobnie trzeba by też dopuścić oprócz formatu *[[podobna nazwa]] - krótka definicja również dodatkowo *[[podobna nazwa]] (wyjaśnienie) - krótka definicja bo taki format wydaje się być używany na sporej liczbie stron, np. w taki sposób: * [[hrabstwo DeKalb (Alabama)|hrabstwo DeKalb]] ([[Język angielski|ang.]] ''DeKalb County'') – w stanie [[Alabama]] i przenoszenie nazwy oryginalnej za myślnik źle by wyglądało.
Pozdrawiam, Michał