Czyli jak kto pracuje
Właśnie zrobiłem w odniesieniu do tej strony:
http://meta.wikimedia.org/wiki/Depth
taką stronę:
http://meta.wikimedia.org/wiki/Non-Articles/Articles
w definicji depth jest jeszcze istotny wskaźnik 1-ratio, który się mnoży z pozostałymi
http://s23.org/wikistats/wikipedias_html.php?sort=good_desc
u nas jest mało nieartykułów do artykułów i mało edycji do artykułów. Czy to jest źle? IMO nie.
Oszczędzamy liczbę edycji - wymagamy od siebie, by przed zapisaniem dawać podgląd i nie nabijać sztucznie licznika. Nie lubimy brudnopisów ze spamem, produkowania drugiej naszej klasy czy facebooka. Wielkość artykułów jest porównywalna z innymi dużymi Wikipediami:
http://stats.wikimedia.org/PL/TablesArticlesGt500Bytes.htm
ale to wskaźnik depth ma być wskaźnikiem jakości. Na stronce, którą zrobiłem widać, że taka definicja jakości (poprzez liczbę stron nie będących artykułami) jest szczególnie korzystna dla en wiki. Nie wspominam już o tym, że my akurat wypracowaliśmy wymuszanie podglądu dla IP, co zmniejsza liczbę wandalizmów i pewnie też rewertów (więc i mniej zbytecznych edycji).
IMO lepszą definicja byłaby taka, która dawałaby odpowiedź na pytanie:
"Ile potrzeba edycji i stron poza przestrzenią główną na wytworzenie 1kb tekstu w haśle?"
Potrzebna byłaby tylko informacja ile przypada bajtów na artykuł. Wg niezbyt precyzyjnych statsów Zachte:
http://stats.wikimedia.org/PL/TablesWikipediaPL.htm
http://stats.wikimedia.org/PL/TablesDatabaseSize.htm
Mamy 1,4 GB na te ponad 550 tys haseł.
Co wy na takie przedefiniowanie - na razie tylko techniczne - to jeszcze nie oznacza jakości merytorycznej.
przykuta
Ostatniego zestawienia wprawdzie nie rozumiem, ale wygląda na to, że nie jest z nami tak źle. ~~~~
W dniu 25 lutego 2009 19:32 użytkownik Przykuta przykuta@o2.pl napisał:
Czyli jak kto pracuje
Właśnie zrobiłem w odniesieniu do tej strony:
http://meta.wikimedia.org/wiki/Depth
taką stronę:
http://meta.wikimedia.org/wiki/Non-Articles/Articles
w definicji depth jest jeszcze istotny wskaźnik 1-ratio, który się mnoży z pozostałymi
http://s23.org/wikistats/wikipedias_html.php?sort=good_desc
u nas jest mało nieartykułów do artykułów i mało edycji do artykułów. Czy to jest źle? IMO nie.
Oszczędzamy liczbę edycji - wymagamy od siebie, by przed zapisaniem dawać podgląd i nie nabijać sztucznie licznika. Nie lubimy brudnopisów ze spamem, produkowania drugiej naszej klasy czy facebooka. Wielkość artykułów jest porównywalna z innymi dużymi Wikipediami:
http://stats.wikimedia.org/PL/TablesArticlesGt500Bytes.htm
ale to wskaźnik depth ma być wskaźnikiem jakości. Na stronce, którą zrobiłem widać, że taka definicja jakości (poprzez liczbę stron nie będących artykułami) jest szczególnie korzystna dla en wiki. Nie wspominam już o tym, że my akurat wypracowaliśmy wymuszanie podglądu dla IP, co zmniejsza liczbę wandalizmów i pewnie też rewertów (więc i mniej zbytecznych edycji).
IMO lepszą definicja byłaby taka, która dawałaby odpowiedź na pytanie:
"Ile potrzeba edycji i stron poza przestrzenią główną na wytworzenie 1kb tekstu w haśle?"
Potrzebna byłaby tylko informacja ile przypada bajtów na artykuł. Wg niezbyt precyzyjnych statsów Zachte:
http://stats.wikimedia.org/PL/TablesWikipediaPL.htm
http://stats.wikimedia.org/PL/TablesDatabaseSize.htm
Mamy 1,4 GB na te ponad 550 tys haseł.
Co wy na takie przedefiniowanie - na razie tylko techniczne - to jeszcze nie oznacza jakości merytorycznej.
przykuta
WikiPL-l mailing list WikiPL-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikipl-l
"Ile potrzeba edycji i stron poza przestrzenią główną na wytworzenie 1kb tekstu w haśle?"
Potrzebna byłaby tylko informacja ile przypada bajtów na artykuł. Wg niezbyt precyzyjnych statsów Zachte:
http://stats.wikimedia.org/PL/TablesWikipediaPL.htm
http://stats.wikimedia.org/PL/TablesDatabaseSize.htm
Mamy 1,4 GB na te ponad 550 tys haseł.
Co wy na takie przedefiniowanie - na razie tylko techniczne - to jeszcze nie oznacza jakości merytorycznej.
przykuta
Nie wiem jak to nazwać - wskaźnik efektywności:
(Liczba słów w artykułach x liczba haseł / liczba nieartykułów x liczba edycji) x (liczba haseł >2kb / liczba haseł <0,5 kb)
liczba słów - bo to nam eliminuje kody html/wiki (np. kod infoboksów) liczba haseł > 2kb / liczba haseł < 0,5 kb - bo to jakoś tam określa ile mamy większych haseł w stosunku do stubów (2kb i 0,5 kb - takie wielkości można akurat znaleźć też w statsach Erika Zachte.
http://stats.wikimedia.org/PL/TablesDatabaseWords.htm
http://stats.wikimedia.org/PL/TablesArticlesGt500Bytes.htm
http://stats.wikimedia.org/PL/TablesArticlesGt1500Bytes.htm
przykuta