[Wikide-l] Weg mit der Löschhölle!

Bjoern Hoehrmann derhoermi at gmx.net
So Dez 13 20:19:59 UTC 2009


* Kai F. Lahmann wrote:
>Die Frage wäre, wie viele der 20% gingen in welche Richtung daneben? 

Um das zu beantworten bräuchte ich eine geeignete Datenbasis. Die Lösch-
begründungen der Administratoren sind ja nicht sehr hilfreich, da wird
gerne mal "Unsinn" mit WP:VAND-Link benutzt statt einem eher zutreffen-
dem "Artikel okay, aber eher unterhalb der Relevanzschwelle" (und wenn
man den Administrator freundlich bittet in Zukunft mehr auf korrekte Be-
gründungen zu achten, revertiert er die Kritik in Sekundenschnelle von
seiner Seite).

>Normalerweise tendieren Spamfilter ja dazu, eher was liegen zu lassen 
>als was gutes zu löschen.

Ich hab in meiner quick'n'dirty Auswertung auch nicht auf die Prozente
geachtet, wenn der Filter sagt 51% "-", 49% "+" zähle ich das als "-".
Mir ging es eigentlich nur darum mal in zwei, drei Stunden zu sehen,
warum da Leute ihre Zeit drauf verwenden manuell Tastaturtests rauszu-
löschen.

An sich war CRM114 auch nicht gut genug dokumentiert für meine Zwecke,
aber ein Bekannter aus dem Usenet hat auf seiner Webseite darauf hinge-
wiesen, dass ausgerechnet Felix von Leitner zumindest vor Jahren den 
Klassifizierer für gut befand, da gefiel mir die Ironie gut genug das
fertig zu machen.

Ich hab für Perl im CPAN das Modul AI::CRM114 eingestellt, damit kann
man ein entsprechendes Script in ein paar Minuten zusammenwürfeln.
Wenn jemand mal ne Woche lang die Neueinstellungen sammlen und die
Verschiebe- und Löschaktionen mitschneiden möchte, um dann händisch
in "völlig unbrauchbar" und "ernsthafter Ansatz" zu teilen, damit man
sich mal ein Bild machen kann, dann stell ich gerne ein entsprechen-
des Script bereit. Mir fehlt im Moment der Server und die Lust zum
händischen nachsortieren um das selbst zu machen.

(Aber auch ohne kann man bei 80% unter diesen Umständen davon ausge-
hen, dass bei guter und umfangreicherer Datenbasis die Quote weit in
die 90er hineinreichen wird, völlig unverständlich warum man da nicht
längst mal nen Google Summer of Code Projekt "löt mal spamfilter und
Recent Changes zusammen und guck was rauskommt" gemacht hat.)
-- 
Björn Höhrmann · mailto:bjoern at hoehrmann.de · http://bjoern.hoehrmann.de
Am Badedeich 7 · Telefon: +49(0)160/4415681 · http://www.bjoernsworld.de
25899 Dagebüll · PGP Pub. KeyID: 0xA4357E78 · http://www.websitedev.de/