On Fri, Jul 16, 2004 at 10:02:54PM +0000, Andrzejgo wrote:
Dyskusja swiadczy o kryzysie w poslugiwaniu sie kategoriami, co mozna bylo przewiedziec - w prawie kazdym projekcie nastepuje taki moment, ze kategorie sa tak liczne, iz zwolna zaczynaja zastepowac hasla. Tym bardziej sprawa staje sie dokuczliwa, im gorszy mechanizm wyszukiwania pelnotekstowego, bo to sklania ludzi do mnozenia kategorii. (Wybaczcie ten z lekka mentorski ton, takie juz mam belferskie nawyki :( )
Kategorii jest na razie za malo, nie za duzo. Spora czesc Wikipedii jest niepokategoryzowana, lub pokategoryzowana zbyt ogolnymi kategoriami.
Szacujac nastepujace wspolczynniki: Ilosc artykulow 35 tysiecy Sredni rozmiar "porzadnej" kategorii 50 (wiekszosc sensownych kategorii oscyluje wokol tej liczby) Srednia ilosc kategorii na artykul 1.2 (sporo artykulow powinno byc w wiecej niz jednej)
Otrzymujemy: Optymalna ilosc kategorii 840 (35k * 1.2 / 50)
Do tego jeszcze pewna ilosc kategorii organizacyjnych, ktore nie zawieraja artykulow a jedynie podkategorie, i kategorii robionych "na wyrost", zawierajacych na razie ilosc artykulow w okolicach 10, ale ktorych nie wypada usunac bo maja dobre prognozy rozwoju, i otrzymamy liczbe rzedu 1000-1200.