[Wikipl-l] Propozycja zmian w szablonach

Michał Kosmulski michal.kosmulski w netsprint.pl
Wto, 8 Maj 2007, 18:28:57 UTC


Czesc,
dziekuje wszystkim za komentarze, zwlaszcza te krytyczne.
Po przemysleniu sprawy, doszedlem do wniosku, ze zaproponowane przeze mnie
poczatkowo podejscie faktycznie byloby zrodlem trudnosci przy edycji stron.
Wpadlem jednak na pomysl, jak mozna osiagnac [prawie] ten sam efekt bez potrzeby
az tak silnej ingerencji w wyglad stron ujednoznaczniajacych. Oczywiscie tak samo
jak pierwotna koncepcja, tutaj tez stosowanie tej techniki lub jej nie stosowanie
nie byloby w zaden sposob wymuszone.

Zatem: zarzucam stara propozycje, a zamiast niej proponuje:
1. Tworzymy szablon o nazwie, dajmy na to, {{link-1-ujednoznacznia}}.
2. Szablon ten jest pusty, tzn. nie wstawia zadnego tekstu w tresc strony. Sluzy
on jedynie za marker, tzn. sama jego obecnosc jest pewna informacja.
3. W tresci strony ujednoznaczniajacej wstawiamy ten szablon na koncu linijki, o
ktorej wiemy, ze sie trzyma wlasciwego formatu, tzn. ze pierwszy link wewnetrzny
prowadzi do hasla opisujacego konkretne znaczenie ujednoznacznianego slowa.
4. Przyklad (znowu lepton):

{{Disambig}}
*[[Lepton (mechanika kwantowa)]] - grupa 12 cząstek elementarnych: [[elektron]],
[[mion]], [[taon]], [[neutrino elektronowe]], [[neutrino mionowe]], [[neutrino
taonowe]] oraz odpowiadające im [[antycząstka|antycząstki]].{{link-1-ujednoznacznia}}
*[[Lepton (moneta)]] - [[moneta]] [[miedź|miedziana]] bita w [[starożytna
Grecja|starożytnej Grecji]].{{link-1-ujednoznacznia}}
*Slowo lepton bywa takze stosowane jako [[obelga]], najczesciej w formie ''[[Ty
leptonie]]''

Dwa pierwsze znaczenia sa oznakowane szablonem, dzieki czemu bot wie, ze pierwszy
link w danym punkcie jest "tym wlasciwym". Ostatni wiersz (oczywiscie wydumany)
nie jest zgodny z ustalonym formatem, wiec nie zawiera szablonu i zostanie przez
bota zignorowany.

Wydaje mi sie, ze takie podejscie byloby znacznie mniej inwazyjne niz to co
proponowalem na poczatku i z czego sie wycofuje.

Poniewaz padalo wiele roznych uwag, postaram sie do nich zbiorczo ustosunkowac
ponizej aby nie mnozyc postow ponad miare:

* Problem z pobieraniem PDF: u mnie dziala, ale jest tez kopia na wikimedia.org,
pod adresem http://pl.wikimedia.org/wiki/Grafika:Netsprint_2007.pdf - moze ta pojdzie.

* Synonimy: uzylem tego slowa w niezbyt scislym znaczeniu. Chodzilo mi nie o
synonimy w rozumieniu gramatyki jezyka polskiego, tylko o "alternatywne tytuly
hasel" - slowa, ktorych wpisanie w wyszukiwarce powinno skutkowac wyswietleniem
innego rekordu. Przykladowo: "Cassius Clay" to prawdziwe imie i nazwisko boksera
znanego jako "Muhammad Ali". Jesli uzytkownik wpisze zapytanie "Cassius Clay",
powinien moc znalezc strone "Muhammad Ali". Jesli takie haslo jest jednoznaczne,
uzywamy redirectow i sprawa jest prosta. Jesli nie jest jednoznaczne, mamy strone
ujednoznaczniajaca i tutaj zaczynaja sie schody.
Wezmy np. strone "Tygrys (ujednoznacznienie)" - ktos kto wpisze haslo "tygrys",
powinien moc znalezc informacje zarowno o zwierzeciu jak i o rzece jak i o
niemieckim czolgu PzKpfw VI Tiger. O ile latwo jest z "Tygrys (rzeka)" usunac
nawias, to dojsc automatycznie do tego, ze szukajac "tygrys" mamy znalezc m.in.
"PzKpfw VI Tiger", raczej sie nie da - wymaga to juz pomocy ze strony czlowieka.
Musimy wiedziec, ze mozna bezpiecznie wziac pierwszy link z wiersza, bo w tym
wypadku mozna to zrobic, ale juz w kolejnym wierszu z tego samego artykulu:
* tygrys – [[Krzyżówka (genetyka)|krzyżówka]] [[pstrąg potokowy|pstrąga
potokowego]] i [[pstrąg źródlany|źródlanego]]
nie mozna tego zrobic, bo wyjdzie, ze "krzyzowka" to jedno ze znaczen slowa
"tygrys" i ze szukajac slowa "tygrys" mamy znalezc artykul "krzyzowka".
Tak wiec istotne jest "znakowanie" tych hasel, ktorych nazwa nie zawiera slowa
"tygrys". Z tymi, ktore je zawieraja, program umie sobie poradzic sam.

* Udostepnienie danych wygenerowanych na bazie Wikipedii: oczywiscie zawarte w
wyniku wyszukiwania z netsprinta streszczenie artykulu z wikipedii jest dostepne
na FDLu i mozna z nim robic wszystko, na co licencja pozwala. Aplikacja, ktora te
rekordy generuje, jest niestety zamknieta i raczej taka pozostanie - na to nie mam
wielkiego wplywu. Jak dokladnie jest z innymi danymi, ktore bot moze wygenerowac,
tego nie wiem; sprawy licencyjne ustalal z Polimerkiem kolega z innego dzialu, w
razie potrzeby moge dac na niego namiar.
Jesli chodzi o prace wikipedystow, to o ile oczywiscie zachecalbym wszystkich do
"znakowania" stron ujednoznaczniajacych, to chodzi mi glownie o *mozliwosc*
takiego znakowania (czyli ustalenie mechanizmu, ktory nie zrobi zbyt wielkiego
zamieszania i nie bedzie przeszkadzal osobom nim nie zainteresowanym), a nie o to
zeby ktos cala prace za mnie *wykonal*. Dostawianie szablonow w "trudnych"
stronach ujednoznaczniajacych moglbym prawdopodobnie w znacznej mierze wykonac sam
(choc oczywiscie wszelka pomoc powitalbym z radoscia). Wyobrazam sobie tez, ze
netsprint nie jest jedynym programem, ktory ze struktury stron ujednoznaczniajacyh
moglby wyciagnac uzyteczne informacje, tak wiec te znaczniki moglyby sluzyc
rowniez innym.

* Arizona (wino) - tez sie zdziwilem ze nie ma jeszcze tego artykulu, w sieci sa
cale strony poswiecone "winom prostym".

Podsumowujac poczatek postu: wycofuje sie z pierwotnej koncepcji, prosze o
komentarze do koncepcji nowej, uzywajacej tylko szablonu-markera :)

Mam nadzieje, ze nawet jesli ostatecznie koncepcja sie nie przyjmie (ale licze, ze
wymyslimy cos co da sie zastosowac w praktyce), to przynajmniej wyniknie z tego
jakas uzyteczna dyskusja na temat stron ujednoznaczniajacych.

Pozdrawiam,
Michal



Więcej informacji o liście dyskusyjnej WikiPL-l