Bald ist es wieder so weit: Unaufhörlich geht die Zahl der von mir "zu beobachtenden Artikel" in Richtung 3000. Nach dem letzten Datenputz waren es 2000, die schnell wieder angewachsen sind.
Damals flogen die Jahres, Tages- und Monatsartikel beispielsweise raus.
Doch kürzlich meinte jemand, dass gerade dies ein zu beobachtende Spielwiese für Platzierungsvandalismen sei. Selbst wenn jeder Admin 3000 Artikel beobachten könnte/wollte, würden wir damit nur 360.000 Artikel abdecken.
Und wie unübersichtlich eine derartige Bebachtungsliste dann sein kann, muss ich wohl keinem schildern.
Sicherlich kann man unaufhörlich die recentchanges anstarren, aber wer macht das schon?
Also, wie haltet ihr das Datenproblem überschaubar?
Gruß
Herrick ______________________________________________________________ Verschicken Sie romantische, coole und witzige Bilder per SMS! Jetzt bei WEB.DE FreeMail: http://f.web.de/?mc=021193
Mein Vorgehen: 1) zuerst guck ich auf die Beobachtungsliste (ca. 250 Einträge). Ich nehme nur diejenigen Artikel auf, die für mich wirklich relevant sind, d.h. zu denen ich eine echte Ahnung habe sowie ein paar zusätzliche, welche dauernd vandaliert werden. 2) guck ich auf meine Benutzereinträge (so die letzten 200) und gucke mir an was sich seither veränderte (dort enteckt man noch manchmal allerlei) 3) Observation "meines" Portals (Portal Schweiz); dort neue Artikel begutachten (nur ab und zu) 4) wenn ich Zeit und Lust habe, die Recentchanges, die Newpages und die Löschkandidaten
Ich gehe da nicht nach System vor sondern nach Lust und Laune.... Wobei: wenn ich mal die Recentchanges verfolge, habe ich manchmal das Gefühl, als wäre ich der einzige der dies tut und muss selbst jedem Vandalen und Möchtegerntestern nachrennen und komme bei der grossen Anzahl an Änderungen kaum mehr nach....
Grischa
On Wed, 23 Mar 2005 09:56:34 +0100, wikipedia-herrick@web.de wikipedia-herrick@web.de wrote:
Bald ist es wieder so weit: Unaufhörlich geht die Zahl der von mir "zu beobachtenden Artikel" in Richtung 3000. Nach dem letzten Datenputz waren es 2000, die schnell wieder angewachsen sind.
Damals flogen die Jahres, Tages- und Monatsartikel beispielsweise raus.
Doch kürzlich meinte jemand, dass gerade dies ein zu beobachtende Spielwiese für Platzierungsvandalismen sei. Selbst wenn jeder Admin 3000 Artikel beobachten könnte/wollte, würden wir damit nur 360.000 Artikel abdecken.
Und wie unübersichtlich eine derartige Bebachtungsliste dann sein kann, muss ich wohl keinem schildern.
Sicherlich kann man unaufhörlich die recentchanges anstarren, aber wer macht das schon?
Also, wie haltet ihr das Datenproblem überschaubar?
Gruß
Herrick ______________________________________________________________ Verschicken Sie romantische, coole und witzige Bilder per SMS! Jetzt bei WEB.DE FreeMail: http://f.web.de/?mc=021193
WikiDE-l mailing list WikiDE-l@Wikipedia.org http://mail.wikipedia.org/mailman/listinfo/wikide-l
wikipedia-herrick@web.de wrote:
Selbst wenn jeder Admin 3000 Artikel beobachten könnte/wollte, würden wir damit nur 360.000 Artikel abdecken.
Denkfehler 1: Deine Annahme, daß jeder Admin ausschliesslich Artikel beobachtet, die von keinem anderen Admin beobachtet werden, ist irrig.
Denkfehler 2: Beobachtungslisten stehen jedem Nutzer zur Verfügung. Die Sicherstellung der Qualität ist keine exklusive Aufgabe von Admins.
Nutzer Foo, der vor 5 Monaten drei gute Artikel geschrieben hat und die nun auf seiner Beobachtungsliste stehen und der selbst nichts mehr ändert, weil die Artikel in Ruhe gelassen werden oder nur von wohlmeinenden Nutzern gepflegt werden, wird von den Statistiken nicht erfasst.
Für unsere SQL-Spezialisten:
1. Gibt es eine SQL-Abfrage für die Liste aller Artikel, die nicht auf einer Benutzerseite eines aktiven Nutzers stehen?
# Nimm eine Liste der aktiven Benutzer # Erstelle eine Liste aller Artikel, die auf den Beobachtungslisten dieser Nutzer sind # Filtere Dopplere heraus # Mache damit den Diff auf die Artikelliste
müsste so oder so ähnlich gehen, oder?
2. Gibt es eine SQL-Abfrage für die Liste aller Artikel, die nicht auf einer Benutzerseite eines aktiven Admins stehen?
Mathias
Mathias Schindler schrieb:
Für unsere SQL-Spezialisten:
- Gibt es eine SQL-Abfrage für die Liste aller Artikel, die nicht auf
einer Benutzerseite eines aktiven Nutzers stehen?
# Nimm eine Liste der aktiven Benutzer # Erstelle eine Liste aller Artikel, die auf den Beobachtungslisten dieser Nutzer sind # Filtere Dopplere heraus # Mache damit den Diff auf die Artikelliste müsste so oder so ähnlich gehen, oder?
Parallel zu den Dumps wird immer eine Liste der Anzahl der Beobachter von Artikeln erstellt: * http://download.wikimedia.org/archives/de/de-count-watchers.txt.gz
Zumindest die ersten drei Schritte wären damit schon einmal getan. Dann gibt es noch eine Übersicht aller Einträge im Artikel-Namensraum: * http://download.wikimedia.org/archives/de/all_titles_in_ns0.gz
Jetzt muss nur noch jemand einen Diff machen ;-)
- Gibt es eine SQL-Abfrage für die Liste aller Artikel, die nicht auf
einer Benutzerseite eines aktiven Admins stehen?
Das wird nicht so leicht gehen wie 1).
mfg Henning.H --[[Benutzer:HenHei]]
Am Mittwoch 23 März 2005 10:36 schrieb Henning Heitkötter:
Zumindest die ersten drei Schritte wären damit schon einmal getan. Dann gibt es noch eine Übersicht aller Einträge im Artikel-Namensraum:
Jetzt muss nur noch jemand einen Diff machen ;-)
Dieser Liste nach, stehen 56.000 Artikel auf den Beobachtungslisten von wenigstens 2 Nutztern und 113.000 Artikel auf der Beobachtungslisten von wenigstens einem Nutzer. Fast die Hälfte der Artikel wird also überhaupt nicht mittels Beobachtungsliste beobachtet. Wieviele Artikel wirklich von aktiven Nutzern beobachtet werden ist noch eine andere Frage. Man kann aber davon ausgehen, dass in der Hälfte der Artikel Blödsinn geschehen kann, und keiner merkt es!
-- Ivo Köthnig
Jetzt muss nur noch jemand einen Diff machen ;-)
Dieser Liste nach, stehen 56.000 Artikel auf den Beobachtungslisten von wenigstens 2 Nutztern und 113.000 Artikel auf der Beobachtungslisten von wenigstens einem Nutzer. Fast die Hälfte der Artikel wird also überhaupt nicht mittels Beobachtungsliste beobachtet.
Wie aktuell ist die Liste der beobachteten Artikel überhaupt? Einige der von mir beobachteten rtikel kommen gar nicht vor (z.B. [[Fundamentalgruppe]], [[Geometrisierung von 3-Mannigfaltigkeiten]], [[Sphäre (Geometrie)]], [[Riemannsche Zahlenkugel]]), obwohl sie von einigen Benutzern bearbeitet (und wohl auch beobachtet werden). Bei anderen Artikel wie [[Kegel (Geometrie)]] oder [[Homotopie]] kann ich nicht glauben, dass ich der einzige Beobachter sein soll.
Gruß, Yonatan
Jonathan Alze schrieb:
Wie aktuell ist die Liste der beobachteten Artikel überhaupt?
Leider sehe ich gerade, dass die Übersicht über die Beobachtungslisten schon ewig nicht mehr aktualisiert wurden: November 2004 :-(
Vielleicht sollte mal jemand einen Developer, der für die Dumps zuständig ist, um eine Aktualisierung bitten (obwohl ich da nicht viel Hoffnung habe). Eigenhändig aus den Dumps ist das nicht zu extrahieren, weil aus verständlichen Gründen die user- und watchlist-Tabellen nicht mit exportiert werden.
mfg Henning --[[Benutzer:HenHei]]
Henning Heitkötter wrote:
Leider sehe ich gerade, dass die Übersicht über die Beobachtungslisten schon ewig nicht mehr aktualisiert wurden: November 2004 :-(
Vielleicht sollte mal jemand einen Developer, der für die Dumps zuständig ist, um eine Aktualisierung bitten (obwohl ich da nicht viel Hoffnung habe). Eigenhändig aus den Dumps ist das nicht zu extrahieren, weil aus verständlichen Gründen die user- und watchlist-Tabellen nicht mit exportiert werden.
Hallo.
Die Liste der beobachteten Artikel wurde von mir erbeten und einmalig erstellt:
http://de.wikipedia.org/wiki/Benutzer:SirJective/Meistbeobachtete_Artikel
James verwendete an seiner Konsole diese Abfrage:
echo ' select count(*) as count, wl_title from watchlist, cur where wl_namespace=0 and wl_namespace=cur_namespace and wl_title=cur_title and cur_is_redirect=0 group by wl_title order by count desc ;' | mysql dewiki | gzip >~/de-count-watchers.txt.gz
Offenbar hat es bisher noch niemand für nötig befunden, die Datei wieder zu löschen. ;)
Die Beobachter selbst werden wie oben erwähnt nicht veröffentlicht; mit der Veröffentlichung der reinen Anzahl hatte James aber kein Problem.
Kate hatte im November auch unter http://wikimedia.org/~kate/nonredirects_sans_watchlist.txt.gz alle unbeobachteten Artikel (Namespace 0, keine Redirects) abgelegt.
Sie verwendete diese Abfrage:
select cur_namespace,cur_title from cur left outer join watchlist on cur_title=wl_title and cur_namespace=wl_namespace where wl_title is null and cur_is_redirect = 0 and cur_namespace = 0;
Gruss, SirJective
Mathias Schindler wrote:
- Gibt es eine SQL-Abfrage für die Liste aller Artikel, die nicht auf
einer Benutzerseite eines aktiven Nutzers stehen?
interessanter wäre eine liste der artikel, die von weniger als 2 benutzern beobachtet werden. einer allein kann eine menge schindluder mit einem artikel betreiben und den fleissig beobachten, ohne dass jemand anders das mal zufällig mitbekommt.
mijobe
"wikipede" skribis:
Mathias Schindler wrote:
- Gibt es eine SQL-Abfrage für die Liste aller Artikel, die nicht auf
einer Benutzerseite eines aktiven Nutzers stehen?
interessanter wäre eine liste der artikel, die von weniger als 2 benutzern beobachtet werden. einer allein kann eine menge schindluder mit einem artikel betreiben und den fleissig beobachten, ohne dass jemand anders das mal zufällig mitbekommt.
... und wenn er einen zweiten Account hat, sogar damit beobachten :-)
Paul, der seine Beobachtungsliste fast nur dazu benutzt, um herauszufinden, ob jemand etwas an meinen Beiträgen auszusetzen hat
On Wed, Mar 23, 2005 at 09:56:34AM +0100, wikipedia-herrick@web.de wrote:
Bald ist es wieder so weit: Unaufhörlich geht die Zahl der von mir "zu beobachtenden Artikel" in Richtung 3000. Nach dem letzten Datenputz waren es 2000, die schnell wieder angewachsen sind.
4621, wobei ich damit einer der drei oder fünf Größten bin und in den letzten zwei Monaten kaum Zeit zum editieren hatte. Ganz allgemein muss man zweispaltig lesen, erst den Artikelnamen, ob der interessant ist oder so und dann noch den Benutzernamen, bei IPs guck ich dann nochmal auf den Artikelnamen ob er vielleicht nicht doch relevant ist.
Wenn man es beschaulicher will sind eigene Listen, Portale oder auch die Inhalsverzeichnisse der WikiReader interessante Lektüre.
Beobachtungslisten können nicht groß genug sein, selbst bei den Jahreszahlen ist es interessant wenn z.B. jemand gleich ein Jahrzehnt bearbeitet dann sollte man kurz reinschaun. Auch interessant ist wenn ein einzelner Benutzer eine Gruppe von Artikeln bearbeitet, da schau ich dann auch zwei oder drei Stichproben an.
ciao, tom