Andreas Brändle schrieb:
Ich poste (allerdings unregelmässig) etwas zum Fortgang des Projekts in meinem Blog http://editthispage.blogspot.com. Dort kannst du auch die grade aktuelle Version des Codebuchs (Version2.3) runterladen. Es ist allerdings noch nicht ganz fertig und ich würde mich sehr über Anregungen freuen.
Hi, ich habe mal das Codebuch und die 0.2 der Liz angeschaut. An einigen Stellen könnte man Details anbringen ("Wikipedia-Software" statt Mediawiki an einer Stelle ist diskutierbar). Dass Wasser bei 100°C kocht, ist so nicht ganz richtig (oder man unterstellt automatisch STP). Das sind aber Kleinigkeiten.
Mal eine methodische Frage: Viele deiner im Codebuch genannten Indikatoren lassen sich automatisch erfassen bzw die Fehlerquote einer automatischen Erfassung ist nicht zwingend grösser als bei einer manuellen Erfassung. Wozu braucht es dann noch überhaupt eine Stichprobe und warum nimmst du nicht einfach die komplette (deutschsprachige) Wikipedia als Grundlage? (und ja, natürlich bei vielen Indikatoren ist ein Mensch schneller. f01 und f02 finde ich nirgends konkretisiert, welche Auflagen welches Werkes meinst du?) Wenn du jetzt schon die Lemmata gezogen hast, wann werden die google-Treffer erfasst und warum geschieht dies nicht zeitnah?
In dem Codebuch gibt es keinen Indikator für edits von Bots, das könnte die Ergebnisse verzerren. Ob ein Account botstatus hat, lässt sich abfragen. Die Fehlerquote ist hoch, da ein Bot nicht angemeldet sein muss oder unter einem Nutzeraccount laufen kann.
Mathias, der das, was er lesen konnte, sehr spannend findet :)