-----Original Message----- From: DaB. Sent: Tuesday, October 25, 2005 8:43 PM
ich entwickle gerade ein Tool (ist schon fast fertig) das die letzen Änderungen durchgeht und den Tool-Benutzer immer fragt, ob der Edit ein Vandalismus war, oder nicht. Die Wörter des diffs werden in eine Datenbanktabelle geschrieben mit einer Bewertung. Für jeden Vandalismusfall geht die Bewertung 1 nach oben, für jeden "Nicht-Vandalismus" 1 nach unten. Ich könnte dir nach einer Weile einen Dumb dieser Tabelle zu Verfügung stellen und du müsstest nur nachsehen, welche Wörter einen gewiessen Wert (z.b: >5) haben.
Übrigends schreibt das Tool die Werte in 2 Tabellen, eine allgemeine und eine pro Artikel. Damit hoffe ich, auch Vandalismuswörter zu finden, die in einem Artikel ganz ok sind (zum Beispiel Fi***en in Sexualartikeln) aber in anderen nicht (z.B. in Geschichtsartikeln).
Meinen Respekt!Wirst Du das Ding dann unter die GPL stellen? Denn mich würde die Technik dahinter interessieren(ich weiss dass esgute KIs gbt, aber welche die Texte verstehen....)
Marco