Czyli jak kto pracuje
Właśnie zrobiłem w odniesieniu do tej strony:
http://meta.wikimedia.org/wiki/Depth
taką stronę:
http://meta.wikimedia.org/wiki/Non-Articles/Articles
w definicji depth jest jeszcze istotny wskaźnik 1-ratio, który się mnoży z pozostałymi
http://s23.org/wikistats/wikipedias_html.php?sort=good_desc
u nas jest mało nieartykułów do artykułów i mało edycji do artykułów. Czy to jest źle? IMO nie.
Oszczędzamy liczbę edycji - wymagamy od siebie, by przed zapisaniem dawać podgląd i nie nabijać sztucznie licznika. Nie lubimy brudnopisów ze spamem, produkowania drugiej naszej klasy czy facebooka. Wielkość artykułów jest porównywalna z innymi dużymi Wikipediami:
http://stats.wikimedia.org/PL/TablesArticlesGt500Bytes.htm
ale to wskaźnik depth ma być wskaźnikiem jakości. Na stronce, którą zrobiłem widać, że taka definicja jakości (poprzez liczbę stron nie będących artykułami) jest szczególnie korzystna dla en wiki. Nie wspominam już o tym, że my akurat wypracowaliśmy wymuszanie podglądu dla IP, co zmniejsza liczbę wandalizmów i pewnie też rewertów (więc i mniej zbytecznych edycji).
IMO lepszą definicja byłaby taka, która dawałaby odpowiedź na pytanie:
"Ile potrzeba edycji i stron poza przestrzenią główną na wytworzenie 1kb tekstu w haśle?"
Potrzebna byłaby tylko informacja ile przypada bajtów na artykuł. Wg niezbyt precyzyjnych statsów Zachte:
http://stats.wikimedia.org/PL/TablesWikipediaPL.htm
http://stats.wikimedia.org/PL/TablesDatabaseSize.htm
Mamy 1,4 GB na te ponad 550 tys haseł.
Co wy na takie przedefiniowanie - na razie tylko techniczne - to jeszcze nie oznacza jakości merytorycznej.
przykuta