[Wikipl-l] Analiza i wizualizacja błędnych interwiki

Tomasz Klim wikimedia w tlen.pl
Czw, 20 Mar 2008, 15:22:54 UTC


Witam

Gdzie można sobie ściągnąć kod źródłowy tego czegoś?

P.W.


-----Original Message-----
From: wikipl-l-bounces w lists.wikimedia.org
[mailto:wikipl-l-bounces w lists.wikimedia.org] On Behalf Of Lukasz Bolikowski
Sent: Tuesday, March 18, 2008 3:41 PM
To: wikipl-l w lists.wikimedia.org
Subject: [Wikipl-l] Analiza i wizualizacja błędnych interwiki

Witajcie,

w ramach doktoratu napisałem narzędzie analizujące graf linków
międzyjęzykowych (interwiki) pomiędzy wszystkimi 256 wersjami
językowymi Wikipedii.

Okazuje się, że na przestrzeni lat nagromadziło się mnóstwo błędnych
linków międzyjęzykowych, które nie są usuwane, bo patrząc "lokalnie"
nie widać, że są błędne.  Odpowiednia analiza + wizualizacja pozwala
natomiast szybko wychwycić źródła błędów.

Główne zalety w stosunku do botów:
* analiza całej problematycznej składowej na raz, zamiast
"lokalnej" oceny sytuacji.
* fajna (IMHO) wizualizacja grafów.
* konkretne rekomendacje: usuń link, podziel artykuł,
połącz artykuły, usuń redirecty.

Wady:
* pracuje na przetworzonych dumpach, a nie na żywej Wikipedii,
więc rekomendacje bywają nieaktualne.
* (chwilowo) nie widzi niektórych redirectów, ze względu na
kiepską jakość dumpów tabeli redirect.  Wg zapewnień na
wikitech-l ma to w przyszłości ulec poprawie.
* wymaga Java Web Start 6 i zjada sporo zasobów.

Wada/zaleta:
* niczego nie zmienia (pokazuje źródła problemów i proponuje zmiany,
pozostawiając decyzję człowiekowi).

Ciekawostka: zakładając możliwość chodzenia "pod prąd" linku
interwiki, największa obecnie spójna składowa w grafie takich
linków ma ponad 48.000 artykułów opisujących ponad 2500 pojęć.
Innymi słowy: wykorzystując wyłącznie linki interwiki można
nawigować pomiędzy ponad 2,5 tys. tematów.

Zachęcam do testowania i uwag.  Narzędzie dostępne jest pod adresem:
   http://wikitools.icm.edu.pl/

Chciałbym zareklamować tę aplikację wśród szeroko rozumianych
poprawiaczy interwiki.  Która lista lub strona na meta jest do
tego celu najodpowiedniejsza?

Pozdrawiam,
Bolo1729

_______________________________________________
WikiPL-l mailing list
WikiPL-l w lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/wikipl-l




Więcej informacji o liście dyskusyjnej WikiPL-l