-----Original Message-----
From: DaB.
Sent: Tuesday, October 25, 2005 8:43 PM
ich entwickle gerade ein Tool (ist schon fast fertig)
das die letzen
Änderungen durchgeht und den Tool-Benutzer immer fragt, ob der Edit ein
Vandalismus war, oder nicht. Die Wörter des diffs werden in eine
Datenbanktabelle geschrieben mit einer Bewertung. Für jeden
Vandalismusfall geht die Bewertung 1 nach oben, für jeden
"Nicht-Vandalismus" 1 nach unten. Ich könnte dir nach einer Weile einen
Dumb dieser Tabelle zu Verfügung stellen und du müsstest nur nachsehen,
welche Wörter einen gewiessen Wert (z.b: >5) haben.
Übrigends schreibt das Tool die Werte in 2 Tabellen, eine allgemeine und
eine pro Artikel. Damit hoffe ich, auch Vandalismuswörter zu finden, die
in einem Artikel ganz ok sind (zum Beispiel Fi***en in Sexualartikeln)
aber in anderen nicht (z.B. in Geschichtsartikeln).
Meinen Respekt!Wirst Du das Ding dann unter die GPL stellen?
Denn mich würde die Technik dahinter interessieren(ich weiss dass esgute KIs gbt, aber
welche die Texte verstehen....)
Marco