[Wikipl-l] [[polski]]/[[polska]]...

Tomasz Ganicz polimerek w gmail.com
Pon, 14 Maj 2007, 07:33:55 UTC


14-05-07, Wlodzimierz Holsztynski <sennajawa w gmail.com> napisał(a):
> On 5/13/07, Daniel Koć <kocio w linuxnews.pl> wrote:
> >
> > [...] chciałem zwrócić waszą uwagę na linkomanię w
> > definicjach, która objawia się w taki mniej więcej sposób (przykład
> > bieżący):
> >
> > '''Katarzyna Pakosińska''' - [[polska]] [[artysta|artystka]]
> > [[kabaret]]owa, [[aktorka]], [[konferansjer]]ka, [[dziennikarka]] [[TV
> > Polonia]].
>
> Mamy do czynienia oprogramowania. Oprócz
> opcjonalnych "autorskich" linków, gdy autorowi
> zależy na specyficznej stronie, powinno być
> przede wszystkim linkowanie 'defaultowe":
> czytelnik zaznacza część tekstu (highlights),
> cyka na guzik "odnośnik", i dostaje ewentalną
> stronę z wikipedii. Takie oprogramowanie
> istniało już w czasach pre-html/internetowych.
> Na przykład Nortona C-compiler miał to, a nawet
> ofiarował tę konstrukcję do używania w innych,
> własnych oprogramowaniach.
>
> Przy tym podejściu byłoby niewiele explicite
> linków (z korzyścią dla wyglądu tekstu).
>
> Widzę argumenty za takimi explicite linkami.
> Grają one wtedy rolę m.in. key words. Tak
> czy inaczej, wartość takiego linkowania dla
> raportów jest podejrzana, gdy różni autorzy
> mają różne zwyczaje.
>
>

Problem w tym, że wysoki pagerank wielu haseł z Wikipedii wynika
właśnie z obfitego linkowania. Zaprzestanie linkowania byłoby zatem
rodzajem "sepuku". Wewnętrzne linki Wikipedii są brane pod uwagę przy
ustalania pageranku.

Ponadto, w języku naturalnym to wcale nie takie proste, że zaznaczamy
frazę i mamy akurat to hasło, które chcemy, szczególnie w językach,
gdzie odmienia się rzeczowniki. W kompilerze języka sprawa jest
prosta, bo każde słowo w programie jest jednoznacznie zdefiniowaną
instrukcją programu lub jej opcją. Łatwo jest zatem stworzyć
mechanizm, który po zaznaczeniu fragmentu tekstu programu wyświetla
hasła z instrukcji na temat słów kluczowych występujących w kodzie
programu.

Z językiem naturalnym sprawa jest dużo bardziej złożona i jest to już
zagadnienie z dziedziny sztucznego przetwarzania tekstu, AI i sieci
semantycznych. W języku naturalnym mamy synonimy, homonimy i wiele
innych niuansów językowych, które utrudniają stworzenie takiego
prostego i skutecznego mechanizmu wyszukiwania haseł.

Więcej o tym:

http://en.wikipedia.org/wiki/Semantic_Wiki

-- 
Tomek "Polimerek" Ganicz
http://pl.wikimedia.org/wiki/User:Polimerek
http://www.poli.toya.net.pl
http://www.ptchem.lodz.pl/en/TomaszGanicz.html


Więcej informacji o liście dyskusyjnej WikiPL-l