On Fri, Jul 16, 2004 at 10:02:54PM +0000, Andrzejgo wrote:
Dyskusja swiadczy o kryzysie w poslugiwaniu sie
kategoriami, co mozna bylo
przewiedziec - w prawie kazdym projekcie nastepuje taki moment, ze kategorie sa
tak liczne, iz zwolna zaczynaja zastepowac hasla. Tym bardziej sprawa staje sie
dokuczliwa, im gorszy mechanizm wyszukiwania pelnotekstowego, bo to sklania
ludzi do mnozenia kategorii. (Wybaczcie ten z lekka mentorski ton, takie juz mam
belferskie nawyki :( )
Kategorii jest na razie za malo, nie za duzo.
Spora czesc Wikipedii jest niepokategoryzowana, lub pokategoryzowana zbyt
ogolnymi kategoriami.
Szacujac nastepujace wspolczynniki:
Ilosc artykulow 35 tysiecy
Sredni rozmiar "porzadnej" kategorii 50 (wiekszosc sensownych kategorii oscyluje
wokol tej liczby)
Srednia ilosc kategorii na artykul 1.2 (sporo artykulow powinno byc w wiecej niz jednej)
Otrzymujemy:
Optymalna ilosc kategorii 840 (35k * 1.2 / 50)
Do tego jeszcze pewna ilosc kategorii organizacyjnych, ktore nie zawieraja
artykulow a jedynie podkategorie, i kategorii robionych "na wyrost",
zawierajacych
na razie ilosc artykulow w okolicach 10, ale ktorych nie wypada usunac bo
maja dobre prognozy rozwoju, i otrzymamy liczbe rzedu 1000-1200.