| -----Original Message----- | From: foundation-l-bounces@lists.wikimedia.org [mailto:foundation-l- | bounces@lists.wikimedia.org] On Behalf Of Milos Rancic | Sent: Thursday, January 08, 2009 2:19 AM | To: Wikimedia Foundation Mailing List | Subject: [Foundation-l] Who The Hell Writes Wikipedia, Anyway? | | A friend of mine put my attention to this blog post [1]. I didn't read | it as it is too late now (I just heard friend's description of the | article), but I think that there is no sense to wait tomorrow for | sharing it. The issue is important enough to be analyzed. | | [1] - http://www.alleyinsider.com/2009/1/who-the-hell-writes-wikipedia- | anyway
Dane nt. procentowego udziału w Wikipedii: 0,7% uczestników dokonuje około 50% edycji, a około 75% edycji (czyli blisko 80%) dokonuje 2% (słownie: dwa procent) uczestników.
Ale inna teza artykułu jest jeszcze lepsza - pojedyncze, wartościowe edycje w artykułach wykonywane przez autsajderów (często IP) generują dziesiątki edycji insajderów.
Pzdr., Janusz "Ency" Dorożyński
2009/1/8 Dorozynski Janusz dorozynskij@wampnm.webd.pl:
| -----Original Message----- | From: foundation-l-bounces@lists.wikimedia.org [mailto:foundation-l- | bounces@lists.wikimedia.org] On Behalf Of Milos Rancic | Sent: Thursday, January 08, 2009 2:19 AM | To: Wikimedia Foundation Mailing List | Subject: [Foundation-l] Who The Hell Writes Wikipedia, Anyway? | | A friend of mine put my attention to this blog post [1]. I didn't read | it as it is too late now (I just heard friend's description of the | article), but I think that there is no sense to wait tomorrow for | sharing it. The issue is important enough to be analyzed. | | [1] - http://www.alleyinsider.com/2009/1/who-the-hell-writes-wikipedia- | anyway
Dane nt. procentowego udziału w Wikipedii: 0,7% uczestników dokonuje około 50% edycji, a około 75% edycji (czyli blisko 80%) dokonuje 2% (słownie: dwa procent) uczestników.
Ale inna teza artykułu jest jeszcze lepsza - pojedyncze, wartościowe edycje w artykułach wykonywane przez autsajderów (często IP) generują dziesiątki edycji insajderów.
I tak naprawdę co tym jest dziwnego?
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Michal Rosa | Sent: Thursday, January 08, 2009 9:38 AM / | I tak naprawdę co tym jest dziwnego?
Michał, dla mnie absolutnie nic. Praktycznie w całej swej znanej sobie nawzajem masie jesteśmy pospolitymi, podrzędnymi redaktorami technicznymi. Ja od lat z uporem propaguję używanie zamiast napuszonej nazwy "wikipedyści" skromnej i adekwatnej "wikipedianie", nazwy zresztą na plwiki historycznie pierwszej i nie mającej nieuprawnionych konotacji do encyklopedystów. Mówiłem zresztą o tym w wywiadzie dla radia Merkury na gedejocie w Poznaniu.
Natomiast taka konkluzja - "to nic dziwnego", i "jesteśmy/cie grupą podrzędnych formaterów" może być bolesna dla tych, którzy się sami napompowali albo których napompowali lub próbują im to robić inni. I tutaj - bez urazy, Roo72 - masz w tym udział twierdząc, że jeszcze bardziej podrzędni stójkowi są (lub muszą być) wizjonerami i przywódcami. Niektórzy mogą w to uwierzyć :-)) .
Pzdr., Janusz "Ency" Dorożyński
2009/1/8 Dorozynski Janusz dorozynskij@wampnm.webd.pl:
| -----Original Message----- | From: wikipl-l-bounces@lists.wikimedia.org [mailto:wikipl-l- | bounces@lists.wikimedia.org] On Behalf Of Michal Rosa | Sent: Thursday, January 08, 2009 9:38 AM / | I tak naprawdę co tym jest dziwnego?
Michał, dla mnie absolutnie nic. Praktycznie w całej swej znanej sobie nawzajem masie jesteśmy pospolitymi, podrzędnymi redaktorami technicznymi. Ja od lat z uporem propaguję używanie zamiast napuszonej nazwy "wikipedyści" skromnej i adekwatnej "wikipedianie", nazwy zresztą na plwiki historycznie pierwszej i nie mającej nieuprawnionych konotacji do encyklopedystów. Mówiłem zresztą o tym w wywiadzie dla radia Merkury na gedejocie w Poznaniu.
"What's in a name? That which we call a rose By any other name would smell as sweet."
Co za różnica czy (w)ikipedysta czy (w)ikpedian czy "nawiedzony twórca web 2.0 wbrew wandalom"?
Natomiast taka konkluzja - "to nic dziwnego", i "jesteśmy/cie grupą podrzędnych formaterów" może być bolesna dla tych, którzy się sami napompowali albo których napompowali lub próbują im to robić inni. I tutaj - bez urazy, Roo72 - masz w tym udział twierdząc, że jeszcze bardziej podrzędni stójkowi są (lub muszą być) wizjonerami i przywódcami. Niektórzy mogą w to uwierzyć :-)) .
To jest zupełnie inna kwestia. Jeżeli pozycję nazywamy administratorem, a z drugiej strony ktoś udaje, że "admin is no big deal", a z trzeciej tym "no big deal" stawiamy w PUA takie wymagania, że nie mogłaby ich spełnić Matka Teresa (gdyby edytowała Wikipedię), a z czwartej.. i tak dalej. Admin is a fucking big deal. To słowo i tak funkcja miała kiedyś jakieś znaczenie i to powinno powrócić choćby poprzez wprowadzenie funkcji/uprawnień ZU. No, może moje wnuki się doczekają.
On Thu, 8 Jan 2009 20:46:11 +1030 "Michal Rosa" michal.rosa@gmail.com wrote:
Michał, dla mnie absolutnie nic. Praktycznie w całej swej znanej sobie nawzajem masie jesteśmy pospolitymi, podrzędnymi redaktorami technicznymi. Ja od lat z uporem propaguję używanie zamiast napuszonej nazwy "wikipedyści" skromnej i adekwatnej "wikipedianie", nazwy zresztą na plwiki historycznie pierwszej i nie mającej nieuprawnionych konotacji do encyklopedystów. Mówiłem zresztą o tym w wywiadzie dla radia Merkury na gedejocie w Poznaniu.
"What's in a name? That which we call a rose By any other name would smell as sweet."
Co za różnica czy (w)ikipedysta czy (w)ikpedian czy "nawiedzony twórca web 2.0 wbrew wandalom"?
http://pl.wikipedia.org/wiki/Wikipedia:Piotr_Spigiel_-_Praca_licencjacka
fragment: "Ciekawa kwestia dotyczy angielskiej Wikipedii, gdzie o samym fakcie, iż jest ona społecznością świadczy nazwa osoby, która jest w ten projekt zaangażowana. Osoba taka nazywa się „Wikipedian”, a nie „Wikipedist”, mimo, iż taka nazwa byłaby bardziej adekwatna ze względu na to, iż osoba, która odpowiedzialna jest za pracę nad zwykłą encyklopedią nazywana jest „encyclopedist”. Dlaczego więc zdecydowano się na odmienną wersję? Ponieważ nazwa „Wikipedian” wskazuje na to, iż dana osoba jest częścią jakiejś grupy lub społeczności. W tym sensie „Wikipedians” to ludzie, którzy tworzą społeczność Wikipedii („The Wikipedia Community”)"
A we francuskiej Wikipedii używa się co prawda terminu „les wikipédiens”, ale zdecydowanie częściej „utilisateurs” („użytkownicy”) bądź „participants”, co podkreśla zorientowanie na odbiorcę, czytelnika.
szw.
W dniu 8 stycznia 2009 09:34 użytkownik Dorozynski Janusz dorozynskij@wampnm.webd.pl napisał:
| -----Original Message----- | From: foundation-l-bounces@lists.wikimedia.org [mailto:foundation-l- | bounces@lists.wikimedia.org] On Behalf Of Milos Rancic | Sent: Thursday, January 08, 2009 2:19 AM | To: Wikimedia Foundation Mailing List | Subject: [Foundation-l] Who The Hell Writes Wikipedia, Anyway? | | A friend of mine put my attention to this blog post [1]. I didn't read | it as it is too late now (I just heard friend's description of the | article), but I think that there is no sense to wait tomorrow for | sharing it. The issue is important enough to be analyzed. | | [1] - http://www.alleyinsider.com/2009/1/who-the-hell-writes-wikipedia- | anyway
Dane nt. procentowego udziału w Wikipedii: 0,7% uczestników dokonuje około 50% edycji, a około 75% edycji (czyli blisko 80%) dokonuje 2% (słownie: dwa procent) uczestników.
Ale inna teza artykułu jest jeszcze lepsza - pojedyncze, wartościowe edycje w artykułach wykonywane przez autsajderów (często IP) generują dziesiątki edycji insajderów.
To trochę odgrzewane jest, bo te badania na które powołuje się artykuł są z 2006 r. :
http://www.aaronsw.com/weblog/whowriteswikipedia
Zresztą metodologia tych badań była mocno krytykowana, głównie z powodu, że autor sam wybrał artykuły do analizy nie wyjaśniając jak to zrobił (twierdził, że losowo ale nie podał jak je losował ani nawet jakie to były artykułu - oprócz jednego) i było tych artykułów raptem kilkanaście.
Ludzie z Wikimedia Foundation zaproponowali mu wtedy bezpośredni dostęp do bieżącej bazy danych i pomoc do zapuszczenia jego skryptu liczącego liczbę znaków poszczególnych kontrybutorów, aby zebrał dane statystyczne z całej Wikipedii-en a nie tylko kilkunastu wybranych artykułów. Nie podjął jednak tego zadania i później już się Wikipedią nie zajmował.
2009/1/8 Tomasz Ganicz polimerek@gmail.com:
W dniu 8 stycznia 2009 09:34 użytkownik Dorozynski Janusz dorozynskij@wampnm.webd.pl napisał:
/
| [1] - http://www.alleyinsider.com/2009/1/who-the-hell-writes-wikipedia- | anyway
Dane nt. procentowego udziału w Wikipedii: 0,7% uczestników dokonuje około 50% edycji, a około 75% edycji (czyli blisko 80%) dokonuje 2% (słownie: dwa procent) uczestników.
Ale inna teza artykułu jest jeszcze lepsza - pojedyncze, wartościowe edycje w artykułach wykonywane przez autsajderów (często IP) generują dziesiątki edycji insajderów.
To trochę odgrzewane jest, bo te badania na które powołuje się artykuł są z 2006 r. :
http://www.aaronsw.com/weblog/whowriteswikipedia
Zresztą metodologia tych badań była mocno krytykowana, głównie z powodu, że autor sam wybrał artykuły do analizy nie wyjaśniając jak to zrobił (twierdził, że losowo ale nie podał jak je losował ani nawet jakie to były artykułu - oprócz jednego) i było tych artykułów raptem kilkanaście.
Niezależnie od metodologii, to w zasadzie nie odbiega od trendów ogólnych, gdzie ok. 1% ze społeczności tworzy treści, co bazuje na
http://www.elatable.com/blog/?p=5
i potem było przenoszone poza serwisy grupowe.
Pozdrawiam,
W dniu 8 stycznia 2009 10:00 użytkownik Agnieszka Kwiecien agnieszka.kwiecien@gmail.com napisał:
2009/1/8 Tomasz Ganicz polimerek@gmail.com:
W dniu 8 stycznia 2009 09:34 użytkownik Dorozynski Janusz dorozynskij@wampnm.webd.pl napisał:
/
| [1] - http://www.alleyinsider.com/2009/1/who-the-hell-writes-wikipedia- | anyway
Dane nt. procentowego udziału w Wikipedii: 0,7% uczestników dokonuje około 50% edycji, a około 75% edycji (czyli blisko 80%) dokonuje 2% (słownie: dwa procent) uczestników.
Ale inna teza artykułu jest jeszcze lepsza - pojedyncze, wartościowe edycje w artykułach wykonywane przez autsajderów (często IP) generują dziesiątki edycji insajderów.
To trochę odgrzewane jest, bo te badania na które powołuje się artykuł są z 2006 r. :
http://www.aaronsw.com/weblog/whowriteswikipedia
Zresztą metodologia tych badań była mocno krytykowana, głównie z powodu, że autor sam wybrał artykuły do analizy nie wyjaśniając jak to zrobił (twierdził, że losowo ale nie podał jak je losował ani nawet jakie to były artykułu - oprócz jednego) i było tych artykułów raptem kilkanaście.
Niezależnie od metodologii, to w zasadzie nie odbiega od trendów ogólnych, gdzie ok. 1% ze społeczności tworzy treści, co bazuje na
http://www.elatable.com/blog/?p=5
i potem było przenoszone poza serwisy grupowe.
No nie - z tego co ten gość twierdzi to w przypadku Wikipedii jest jakby na odwrót, czyli mamy tę piramidę odwróconą do góry nogami. Mamy podobno mieć setki tysięcy anonimowych "dodawaczy treści", którzy trochę popiszą i zaraz odchodzą oraz nieliczną grupę edytorów i korektorów, którzy tworzą trwałą społeczność Wikipedii.
Są inne badania, które wskazują, że tak nie jest - tzn. że anonimowi, przypadkowi kontrybutorzy dodają tylko mały odsetek treści, a większość treści tworzona jest przez stałą społeczność Wikipedii.
IMHO cała sytuacja jest dużo bardziej złożona. Faktem jest, że pewien, dość znaczny odsetek stałych członków społeczności zajmuje się głównie pracą edycyjną i korektorską (trudno bez dokładnych badań powiedzieć jaki). Jest też jednak spory odsetek stałych członków społeczności, który głównie dodaje treść i edytuje oraz koryguje artykuły tylko z pewnego zakresu tematycznego, który go interesuje. Tak działa np: większość wikiprojektów, które często produkują wspólnie całe serie artykułów z jednej, wąskiej dziedziny w sposób dość planowy. IMHO w tym trybie obecnie powstaje olbrzymia większość najbardziej wartościowych artykułów. Mamy też pewien odsetek "samotnych wilków", którzy edytują sami całe serie artykułów. Są to w większości zalogowaniu userzy, aczkolwiek jest też trochę takich, którzy uporczywie nie chcą się zalogować, ale nie ma ich zbyt wielu. Tych stale piszących "IP" nie wiadomo w sumie jak zakwalifikować - nie są to członkowie społeczności - w sensie, że się nie udzielają w dyskusjach ale są jednak stałymi kontrybutorami.
Natomiast jeśli chodzi o niestałych kontrybutorów - to tu zapewne też się można spodziewać dość złożonego obrazu. Po pierwsze nie są to wyłącznie IP, lecz także czerwone a nawet niebieskie linki. Można wśród nich zaobserwować najróżniejsze przypadki, do których najczęściej zaliczają się: *kontrybutorzy dodający duże ilości niesformatowanego tekstu - na szybko - bez zapoznania się z zasadami i zaleceniami - spory odsetek ich kontrybucji jest szybko usuwany - bo albo się do niczego nie nadaje albo jest prawie na pewno NPA - warto zauważyć że ew. bot obliczający ile i przez kogo zostało dodane treści do artykułu może tymi edycjami być łatwo zmylony - policzy, że edycja dodała np: 10 000 znaków i nie weźmie pod uwagę, że wszystko to zostało po kolejnych edycjach wywalone *na drugim skraju są anonimowi korektorzy - tacy też są i jest ich całkiem sporo - wielu IP poprawia literówki - widać to w OZ chociażby, są też anonimowe "czerwone linki", które robią to sami *grupę pośrednią tworzą Ci, którzy pasują do modelu zaproponowanego przez Swartza - czyli tacy co przychodzą, napiszą kilka artykułów, które potem ktoś skoryguje i odchodzą *są też tacy, którzy najpierw się logują, piszą na swojej stronie jacy to są wspaniali i następnie zaczynają pisać w brudnopisie rzeczy, które nie bardzo się nadają do Wikipedii po czym po paru nieudanych próbach wstawienia tego do przestrzeni głównej odchodzą obrażeni *i pewnie da się zaobserwować jeszcze wiele innych modeli funkcjonowania nie-stałych kontrybutorów.
Żeby sobie odpowiedzieć na pytanie, który z tych modeli ma jaki udział w tworzeniu treści w Wikipedii trzeba by zrobić dokładne badania statystyczne - bo metodą "analizuję kilkanaście artykułów, które sobie wybiorę" można "udowodnić", że każdy z tych modeli jest dominujący - zależnie od tego co chce "udowodnić" badacz.
Żeby sobie odpowiedzieć na pytanie, który z tych modeli ma jaki udział w tworzeniu treści w Wikipedii trzeba by zrobić dokładne badania statystyczne - bo metodą "analizuję kilkanaście artykułów, które sobie wybiorę" można "udowodnić", że każdy z tych modeli jest dominujący - zależnie od tego co chce "udowodnić" badacz.
Dokładnie tak - na razie przypuszczamy siedząc na OZ jak jest, bo na pewne rzeczy zwracamy bardziej uwagę a na inne mniej i dlatego od czasu do czasu ktoś wyskakuje z hasłem ze 99% z IP to wandalizmy. Ale jeśli się wejdzie na OZ i wybierze opcje sprawdzania tylko IP, to wychodzi, że co najmniej 50% to wartościowe edycje.
Co do tego przeklejania z brudnopisów i zatrzymywaniu się na "własnej przestrzeni" nazw, to jest ciekawy problem jaki obserwuje od dłuższego czasu, a czasami sygnalizuję w kawiarence. Być może warto byłoby śledzić wpisy w przestrzeni usera (powiedzmy tylko nowe strony), aby zanim gość (po miesiącu pracy) wklei treść z brudnopisu wpisać mu się, że takich to a takich tekstów w encyklopedii nie zamieszczamy.
Ze statsów Zachte (ostatnich) i nieco spieprzonych co do pl wiki (jeżlei chodzi o tempo przyrostu haseł i aktualną ich liczbę)
http://stats.wikimedia.org/PL/TablesWikipediaPL.htm
Edycje Wikipedians Edycje razem 1 22548 100.0% 6056539 100.0% 3 15822 70.2% 6044936 99.8% 10 11262 49.9% 6017180 99.4% 32 6505 28.8% 5932173 97.9% 100 3488 15.5% 5762617 95.1% 316 1793 8.0% 5461282 90.2% 1000 889 3.9% 4941436 81.6% 3162 411 1.8% 4088470 67.5% 10000 134 0.6% 2594368 42.8% 31623 14 0.1% 734085 12.1% 100000 1 0.0% 113639 1.9%
na en
http://stats.wikimedia.org/PL/TablesWikipediaEN.htm
Edycje Wikipedians Edycje razem 1 423586 100.0% 38248624 100.0% 3 240259 56.7% 37854995 99.0% 10 105664 24.9% 37073400 96.9% 32 47598 11.2% 36302312 94.9% 100 31970 7.5% 35150969 91.9% 316 14847 3.5% 32170449 84.1% 1000 6358 1.5% 27458518 71.8% 3162 2170 0.5% 20154771 52.7% 10000 504 0.1% 11094410 29.0% 31623 61 0.0% 4038259 10.6% 100000 8 0.0% 1486525 3.9% 316228 1 0.0% 328398 0.9%
I to dotyczy tylko głównej przestrzeni nazw.
Co do odchodzenia, to jednak często też daleko idące mity. Ktoś odchodzi, ale potem powraca, choć często pod innym nickiem. Albo ktoś robi dwie, trzy edycje, odchodzi, ale po paru miesiącach, a nawet latach wraca. Chociaż to pewnie nie aż tak duży odsetek. Tu jest trochę jak z kotem Schroedingera - nie wiemy, czy ktoś odszedł na zawsze (zmarł), czy tylko próbował i powróci (żyje). To, że odszedł wcale nie musi wynikać z tego, że się obraził - niektórzy wolą inne formy rozrywki :)
przykuta
Dane nt. procentowego udziału w Wikipedii: 0,7% uczestników dokonuje około 50% edycji, a około 75% edycji (czyli blisko 80%) dokonuje 2% (słownie: dwa procent) uczestników.
Ale inna teza artykułu jest jeszcze lepsza - pojedyncze, wartościowe edycje w artykułach wykonywane przez autsajderów (często IP) generują dziesiątki edycji insajderów.
To jest kwestia przyjęcia definicji uczesntika, bo jeśli ktoś raz poprawił literówkę "na próbę" albo, gdy tym bardziej zrobił wandalizm. Z drugiej strony mamy boty, które są programami, a pierwsza dziesiątka edytorów to właśnie boty.
Poza tym to już dość stare :) Parokrotnie piramidki z tymi statsami wrzucałem na tę listę
przykuta
2009/1/8 Dorozynski Janusz dorozynskij@wampnm.webd.pl
Dane nt. procentowego udziału w Wikipedii: 0,7% uczestników dokonuje około 50% edycji, a około 75% edycji (czyli blisko 80%) dokonuje 2% (słownie: dwa procent) uczestników.
Tak, zasada Pareto 80/20 na ogół nie działa, bo to prawie pseudonauka. W zależności od miary statystycznej, zwanej koncentracją rozkładu, proporcje moga być prawie dowolne, ale spece od zarządzania potrzebują prostych haseł przy których nie trzeba myśleć, więc nawet w podręcznikach ekonometrii twardo pisze się o zasadzie 80/20, jakby koncentracja rozkładu była stałą matematyczną. Jednocześnie w tych samych podręcznikach podaje się wzór na indeks Giniego do pomiaru koncentracji i nie widzi żadnego problemu.
Pozdr. Olaf