Stan Zurek wrote:
- Wygenerowanie statystyk może pomóc w kilku kwestiach, może być pewną
wskazówką, ale w żadnym wypadku nie może być oceną jakości.
Do rozróżnienia czy coś jeszcze jest zalążkiem czy nie wystarczy automat (moim zdaniem)
A IMO - nie. 100 słów to zalążek a 105 już nie?
natomiast byłoby fajne narzędzie/pomoc/co tam jeszcze do niemal automatycznego zgłaszania że coś urosło na tyle żeby się podjąć oceny jakości ręcznie.
Może. Jeśli faktycznie ktoś by to robił, to czemu nie. Ale wiem, że zorganizowane, koordynowane edytowanie średnio na pl.wiki wychodzi.
Jeszcze raz powtarzam, że to ma być *pomoc* a nie całkowite *zastąpienie* elementu ludzkiego. Nie o to chodzi.
No i OK.
- Statystyki dla każdego artykułu można wygenerować, ale wrzucanie tego
wszystkiego do stron dyskusji byłoby zabójstwem dla wiki - 550k zmian.
Tego nie trzeba robić w jednym rzucie i natychmiast.
To akurat nic nie zmienia. Tak czy tak to jest zrobienie setek tysięcy edycji i dodanie przynajmniej 100MB danych do dumpa wiki.
Jak już jakiś bot łazi po artykułach (interwiki i takie tam) to można wtedy zrobić przy okazji automatyczną ocenę.
To nie zmienia, że każdy artykuł będzie zmieniony.
Co więcej, ja bym to widział w taki sposób, że informację skondensować maksymalnie (np same 3-pikselowe paski kolorów, tak że cała "tabelka" zmieściła by się w jednym lub dwóch wierszach np. na dole każdego artykułu.
Kolejna informacja, kompletnie zbędna normalnemu użytkownikowi, powiększająca artykuł. Do tego nie rozumiem za bardzo - przecież jak już ktoś wejdzie na artykuł, to widzi wszystko, statystyk nie potrzebuje.
Wówczas przed każdym zapisaniem niech jakiś AutoBot poprzelicza wskaźniki w wrzuci odpowiedni szablon (obecnie tylko około 200 znaków wywołania, ale można oczywiście dużo bardziej skompresować).
...i do każdej jednej edycji artykułu dochodzi kolejna. Utopia. Wikimedia nas zabije.
Lepiej np. skorzystać z toolservera, wrzucić wszystko do SQLa i generować na bieżąco
Ano można. Ja zaproponowałem tylko jakąś tam koncepcję wizualną, rozwiązanie techniczne może być dowolne. Pragnę przypomnieć, że Wikipedię tworzymy nie dla siebie tylko dla Czytelników, więc aby podnieść wiarygodność należałoby takie wyniki wyświetlać w taki sposób aby były one dostępne dla każdego (co nie jest takie proste zważając, że gro czytelników nie wie nawet o istnieniu stron dyskusji). No chyba że nie chcemy wyświetlać, że mamy słabe artykuły, ale to jest osobne zagadnienie.
Już się gubię. To teraz te "niezmiernie ważne informacje" mają być dla czytelników, nie dla edytorów? Co czytelnikowi z ilości słów w artykule? W jaki sposób to podwyższa wiarygodność? Chyba coś tu jest nie tak.
A jeśli już to "musi" być tak rozpowszechnione, to można przecież dodać poprzez skórkę linki z artykułu do toolservera - nie powiększając kosmicznie dumpa.
- Faktycznej oceny jakości nie da się zautomatyzować.
Co nie oznacza, że nie możemy zaimplementować czegoś automatycznego co byłoby pomocne.
Owszem, tu się nie spieram.
próbowałem zainteresować "społeczność" oceną ręczną, podobną do tej z en.wiki - http://pl.wikipedia.org/wiki/Wikipedysta:Leafnode/Ocena_jako%C5%9Bci To, i ocena istotności pomogłaby projektom skoordynować pracę - informując, które istotne artykuły są słabo opracowane. Ale odzew był mizerny, żeby nie mówić "żaden".
Masz szczęście że cię nie skrytykowali przynajmniej :-) Z tego co widzę to Twój pomysł nie różni się aż tak bardzo od mojego (cytuję): "Czwórka - Jest to najwyższa ocena, jaką może uzyskać artykuł, nieprzechodząc przez formalne procedury oceny." Podobnie u mnie Krótki i Średni może zostać przyznany bez "formalnych" procedur.
Różnica jest taka, że brak "formalnych procedur" nie oznacza przyznawania tego statusu za ilość słów.
- Krytykanctwem nazywanie innej oceny Twojego pomysłu niż pozytywna
jest co najmniej nie na miejscu.
"Inna ocena" jest jak najbardziej wskazana, ale nie lubię kiedy ludzie odnoszą się do czegoś bez próby zrozumienia a już na pewno bez przeczytania podanych argumentów. Nigdzie nie twierdziłem że status Dobrego i Medalowego mają być przyznawane botem, a takie zarzuty pojawiły się jako pierwsze. A tego już niestety nie mogę nazwać konstruktywną krytyką.
Wiesz, tu przede wszystkim tytuł wątku nastawia negatywnie człowieka ;) Wszyscy "krytykanci" odnosili się właśnie do idei, jakoby analiza automatyczna miała być jakimkolwiek wyznacznikiem jakości artykułu. I ja się pod tym też podpisuję.
- Kryteria ilościowe nigdy nie są dobre (więcej nie zawsze jest lepiej,
więc generalizacja tu nie pomoże).
No ale fajnie byłoby mieć jakąś kategorię/listę artykułów których długość/ilość grafik/źródeł wzrosła na tyle, żeby się można zainteresować przyznaniem statusu Dobrego, prawda? W chwili obecnej trzeba to robić ręcznie co przy 500k artykułach nie jest takie wcale znowu proste.
Już napisałem wyżej o tym. Jako narzędzie statystyczne, proszę bardzo. Do tego nie trzeba niczyjego pozwolenia, ani nawet pomocy.
- Używanie interwiki jako wyznaczników czegokolwiek nigdy nie lubiłem -
To jest tylko jedna z mierzalnych "zmiennych" - zaproponujmy coś innego jeśli się lepiej nadaje. To była koncepcja, więc może ewaluować. Ale niech się pojawiają nowe pomysły a nie tylko krytyka tych istniejących...
"Zmienne" są opisane w kryteriach na DA/AnM. Natomiast do robienia statystyk - jak najbardziej, info można zamieścić, ale jako sucha liczba.
ale kto będzie siedział i przeglądał wszystkie artykuły bez interwiki, zwłaszcza w kontekście DA/AnM? Przecież to pierwsza rzecz, która jest sprawdzana przy zgłoszeniu kandydatury...
Odbieram to jako sprzeczność rozumowania tutaj - najpierw piszesz że interwiki to nie wyznacznik a potem że się to jednak sprawdza. Więc zaprząc do tego bota i uprościć życie ludziom, a szczególnie nowicjuszom.
Gdzie tu sprzeczność? Sprawdza się, ale to nie jest warunek - ani konieczny, ani wystarczający.
/leafnode