* rainersti wrote:
Mich würde auch interessieren, wie viele der Lösch-Entscheidungen Beiträge von IPs und Beiträge von angemeldeten Nutzern betrafen.
Um da die richtigen Zahlen zu liefern müsste ich mein Skript überarbei- ten um Sonderfälle wie "Anlage unter falschem Lemma, Verschiebung mit Weiterleitung, und dann Löschung des 'Verschieberests'" genau einzuord- nen (auch zähle ich im Moment "Erstellung durch Verschiebung aus dem Benutzernamensraum" nicht als neuen Artikel) aber mal grob überschlagen gibt es zu der Anfrage "Wurde von angemeldetem Benutzer neu erstellt und wurde nicht verschoben und wurde gelöscht" rund jeden zehnten neuen Artikel, ignoriert man Verschiebungen, im Beobachtungszeitraum (der mit von Sonntag nachts bis Montag Nachmittag nicht ideal liegt).
Was die nicht angemeldeten Benutzer angeht wären hier mal die Artikel zu der Anfrage "Lemma enthält Interrogativpronomen" aus dem Zeitraum:
* Mit wievielen schiffen Ferdinand magellan um die welt gesegelt * Warum wandern die Leute * Warum wandern die tiere * Warum werden regenwälder abgeholzt * Was bedeutet konfirmation * Was bieten die katholischkirche an? * Was ist cholesterin * Was ist die grosse staat von neuseeland * Was ist die mehrzahl von ananas * Was ist eine pistole? * Was kann man im chatroom machen * Was meinten griechen mit demokrati * Was sieht das auge zuerst bei zwei bilder * Was versteht man unter dem Begriff Universalgenie * Wer glaubt an einen gott * Wer hat die wodka erfunden ? * Wer war dietrich bonhoeffer * Wie alt ist köhler * Wie ein Hai schläft * Wie heißen queen * Wie lange lebte jesus * Wie recht net man pi ohne eine taschenrechner aus * Wie schnell war ein segelschiff * Wie viele Katholiken und protestanten gibt es zurzeit in deutschland * Wie viele fußballclubs gibt es in deutschland 2009 * Wie viele länder hat europa * Wo liegt meine website * Wo sind fische verbreitet * Woher kommt das klavier * Woraus bestand der erste Kompass? * Woraus besteht Horn * Wozu dienen klöster
Die machen auch gut 5% der Schnelllöschungen aus und sind wohl mit am offensichtlichsten eher auf schlechte Benutzerführung zurückzuführen als auf Böswilligkeit oder geplante aber leider gescheiterte Artikel- versuche. Hier wäre es mal geboten die Logs dahingehend auszuwerten, wie die Benutzer auf die Erstellungsmaske kamen (nahe liegt der Link in den Suchergebnissen, aber "wik" Shortcuts im Browser oder Änderung in der Adresszeile mögen auch ihren Anteil haben).
Umgekehrt kann man sich über die MediaWiki API übrigens leicht anzeigen lassen, welche Beiträge von nicht-angemeldeten Benutzern behalten werden, z.B. (hier werden Weiterleitungen ausgeschlossen, das sind rund 50 Artikel pro Tag wenn man da mal die aktuellsten Daten nimmt).
Und via
bekommt man die neuen Weiterleitungen von allen Benutzern, das sind aktuell grad 478 in den letzten 48 Stunden; setzt man ein "!" vor das "redirect" gibt es die richtigen Artikel, das sind 478 (sic) in den letzten 24 Stunden, wenn ich mich jetzt nicht verguckt hab. Über die letzten 12 Tage gab es von nicht angemeldeten Benutzern gut 500 neue Artikel plus 200 neue Weiterleitungen.
Bjoern, deinen Ansatz finde ich hervorragend. Selbst wenn man sehr vorsichtige Filterregeln setzt, dürfte wohl mindestens die Hälfte des Krempels automatisch entsorgt werden, was Druck von den Eingangskontrolleuren nimmt und ihnen erlaubt, etwas entspannter und gründlicher an die übrigen Kandidaten zu gehen.
Eine gewisse Fehlerquote wird es so oder so geben, doch glaube ich nicht, dass die eines brauchbaren Filters höher sein wird als die von Eingangskontrolleuren, die im Minutentakt entscheiden - eher im Gegenteil.
Lässt sich so etwas parallel als Test für eine Weile veranstalten? Dann hätten wir belastbare Vergleichswerte.
Gruß, Rainer