2008/9/7 Leafnode <wiki(a)leon.w-wa.pl>pl>:
1. Wygenerowanie statystyk może pomóc w kilku
kwestiach, może być pewną
wskazówką, ale w żadnym wypadku nie może być oceną jakości.
Do rozróżnienia czy
coś jeszcze jest zalążkiem czy nie wystarczy
automat (moim zdaniem)
A IMO - nie. 100 słów to zalążek a 105 już nie?
Racja, brzmi dość śmiesznie.
Przyszło mi do głowy, że bot nie musi ustalać konkretnych granic.
Może wystarczy za niektóre rzeczy dodawać punkty, a za niektóre
odejmować. Trochę tak jak w filtrach antyspamowych.
W takiej sytuacji wyniki bota nie dzieliłyby artykułów na krótkie,
dobre i na medal, ale na te, które otrzymały mniej, średnio i więcej
punktów. No i oczywiście byłyby to tylko wyniki pomocnicze,
na których wikipedyści mogliby się opierać.
Również jestem zdania, że nie jest to rozwiązanie bezbłędne
i kompleksowe, ale, nawet z pewną dozą wyników fałszywych,
może stać się pomocne w odnajdywaniu kandydatów do DA/AnM,
lub - kto wie - może różnych innych typów artykułów, które dałoby
się wyłowić na podstawie danych statystycznych/heurystycznych :)
--
Maciej Łebkowski,
http://lebkowski.info/kontakt.php