[Wikide-l] Automatisierte Kontrolle von Neuen Artikeln

Bjoern Hoehrmann derhoermi at gmx.net
Fr Dez 18 18:21:40 UTC 2009


* rainersti wrote:
>Mich würde auch interessieren, wie viele der Lösch-Entscheidungen
>Beiträge von IPs und Beiträge von angemeldeten Nutzern betrafen.

Um da die richtigen Zahlen zu liefern müsste ich mein Skript überarbei-
ten um Sonderfälle wie "Anlage unter falschem Lemma, Verschiebung mit
Weiterleitung, und dann Löschung des 'Verschieberests'" genau einzuord-
nen (auch zähle ich im Moment "Erstellung durch Verschiebung aus dem
Benutzernamensraum" nicht als neuen Artikel) aber mal grob überschlagen
gibt es zu der Anfrage "Wurde von angemeldetem Benutzer neu erstellt
und wurde nicht verschoben und wurde gelöscht" rund jeden zehnten neuen
Artikel, ignoriert man Verschiebungen, im Beobachtungszeitraum (der mit
von Sonntag nachts bis Montag Nachmittag nicht ideal liegt).

Was die nicht angemeldeten Benutzer angeht wären hier mal die Artikel
zu der Anfrage "Lemma enthält Interrogativpronomen" aus dem Zeitraum:

  * Mit wievielen schiffen Ferdinand magellan um die welt gesegelt
  * Warum wandern die Leute
  * Warum wandern die tiere
  * Warum werden regenwälder abgeholzt
  * Was bedeutet konfirmation
  * Was bieten die katholischkirche an?
  * Was ist cholesterin
  * Was ist die grosse staat von neuseeland
  * Was ist die mehrzahl von ananas
  * Was ist eine pistole?
  * Was kann man im chatroom machen
  * Was meinten griechen mit demokrati
  * Was sieht das auge zuerst bei zwei bilder
  * Was versteht man unter dem Begriff Universalgenie
  * Wer glaubt an einen gott
  * Wer hat die wodka erfunden ?
  * Wer war dietrich bonhoeffer
  * Wie alt ist köhler
  * Wie ein Hai schläft
  * Wie heißen queen
  * Wie lange lebte jesus
  * Wie recht net man pi ohne eine taschenrechner aus
  * Wie schnell war ein segelschiff
  * Wie viele Katholiken und protestanten gibt es zurzeit in deutschland
  * Wie viele fußballclubs gibt es in deutschland 2009
  * Wie viele länder hat europa
  * Wo liegt meine website
  * Wo sind fische verbreitet
  * Woher kommt das klavier
  * Woraus bestand der erste Kompass?
  * Woraus besteht Horn
  * Wozu dienen klöster

Die machen auch gut 5% der Schnelllöschungen aus und sind wohl mit am
offensichtlichsten eher auf schlechte Benutzerführung zurückzuführen
als auf Böswilligkeit oder geplante aber leider gescheiterte Artikel-
versuche. Hier wäre es mal geboten die Logs dahingehend auszuwerten,
wie die Benutzer auf die Erstellungsmaske kamen (nahe liegt der Link
in den Suchergebnissen, aber "wik" Shortcuts im Browser oder Änderung
in der Adresszeile mögen auch ihren Anteil haben).

Umgekehrt kann man sich über die MediaWiki API übrigens leicht anzeigen
lassen, welche Beiträge von nicht-angemeldeten Benutzern behalten
werden, z.B. (hier werden Weiterleitungen ausgeschlossen, das sind
rund 50 Artikel pro Tag wenn man da mal die aktuellsten Daten nimmt).

  <http://de.wikipedia.org/w/api.php?action=query&list=recentchanges&rcprop=title&rcshow=anon|!redirect&rctype=new&rclimit=100&rcnamespace=0>

Und via

  <http://de.wikipedia.org/w/api.php?action=query&list=recentchanges&rcprop=title|timestamp&rcshow=redirect&rctype=new&rclimit=500&rcnamespace=0>

bekommt man die neuen Weiterleitungen von allen Benutzern, das sind
aktuell grad 478 in den letzten 48 Stunden; setzt man ein "!" vor das
"redirect" gibt es die richtigen Artikel, das sind 478 (sic) in den
letzten 24 Stunden, wenn ich mich jetzt nicht verguckt hab. Über die
letzten 12 Tage gab es von nicht angemeldeten Benutzern gut 500 neue
Artikel plus 200 neue Weiterleitungen.
-- 
Björn Höhrmann · mailto:bjoern at hoehrmann.de · http://bjoern.hoehrmann.de
Am Badedeich 7 · Telefon: +49(0)160/4415681 · http://www.bjoernsworld.de
25899 Dagebüll · PGP Pub. KeyID: 0xA4357E78 · http://www.websitedev.de/