Hiho,
hier mal wieder etwas zum Stand: Mittlerweile sind etwa ein Drittel aller Artikel (genauer: 275.000) mindestens einmal gesichtet worden. Nach der letzten Diskussion auf dieser Liste wurden die Anforderungen an die Erstsichtung erhöht, siehe dazu http://de.wikipedia.org/wiki/Wikipedia:Gesichtete_Versionen#Erstmalige_Sicht....
Es gibt 2932 Sichter. Hier zeigt sich, wie wichtig die automatische Rechtevergabe ist, es gibt nämlich hunderte Benutzer, die sich um Metakram so richtig gar nicht scheren und die nie auf die Idee kommen würden, auf irgendeiner Seite die Rechte zu beantragen. Verwirrung scheint dadurch so weit ich das mitkriege nicht zu entstehen, viele von denen merken meiner Einschätzung nach gar nicht, dass sie plötzlich automatisch sichten.
Aka (vielen vielen Dank) hat sein Statistiktool http://toolserver.org/~aka/cgi-bin/reviewcnt.cgi nochmal deutlich erweitert, Die Anzahl der Artikeln mit noch zu sichtenden Änderungen ist seit einigen Tagen bei Tausend oder drunter, das ist sehr befriedigend. @Aka: Schön wäre noch, einmal pro Stunde den durchschnittlichen Lag auszurechnen und rauszuschreiben.
Von der technischen Seite wurde jetzt das letzte große Problem behoben: Es ist nun möglich Vorlagen (und lokale Bilder) zusichten. Wird eine Vorlage geändert, wird in einer aktuellen gesichteten Version dann allen (IPs und Benutzern) die letzte gesichtete Vorlage angezeigt, so dass Änderungen an einer Vorlage nicht mehr dafür sorgen, dass die Version mit sinnvoll geänderter Vorlage erst nach einem weiteren Klick sichtbar wird und dann auch noch als ungesichtete angezeigt wird. In den nächsten Tagen erkläre ich das konkrete Verhalten nochmal genauer, auf der entsprechenden Seite. Was bedeutet das? Ab gestern ist die Extension überhaupt erst so, dass man überlegen kann, ob man sie in Dauerbetrieb übernimmt. Vorher war sie nicht akzeptabel für eine dauerhafte Nutzung.
Und nochmal eine Erklärung: Warum hat die Software eigentlich so viele Bugs? Tja, zum Einen haben viel zu wenig Leute haben an der Testphase auf de.labs.wikimedia.org teilgenommen. Es waren einfach zu wenige Augen an den Vortests beteiligt, trotz mehrfacher öffentlicher Ankündigungen. Das viel größere Problem ist aber: Es gibt einfach keine sinnvolle Testplattform für die Wikipedia außer der Wikipedia selbst. Wikipedia ist extrem komplex und einzigartig. Natürlich wäre es vorstellbar, eine Testplattform zu entwickeln mit klaren Checklisten was getestet werden muss, etc., siehe dazu das oben erwähnte Problem der zu wenigen Entwickler. Das sind eben keine paar tausend wie bei Microsoft, sondern gerade mal 5-10, von denen alle bis auf 2 Freiwillige sind.
Warum die deutsche WP? Weil wir die coolen Jungs und Mädels sind, die international für Qualität stehen. Ich finds toll: Wir sind mit dieser Sache an der Speerspitze der Weiterentwicklung von MediaWiki zu einer deutlichen qualitativen Verbesserung der WP.
Eine Frage die sich mir aufdrängt ist, ob man in Anbetracht dessen, dass das Nachsichten in dieser Form skaliert (und das schon vor der Korrektur für das Vorlagenhandling), nun testweise die Anforderungen an Sichtungen hochsetzt, etwa in Form einer Plausibilitätskontrolle und wie diese genau aussehen könnte.
Viele Grüße
Philipp
Hallo,
@Aka: Schön wäre noch, einmal pro Stunde den durchschnittlichen Lag auszurechnen und rauszuschreiben.
das letzte Diagramm auf http://toolserver.org/~aka/cgi-bin/reviewcnt.cgi?lang=german&action=imag...
stellt genau diese sich über die Zeit verändernde Anzahl graphisch dar. Oder meinst du etwas anderes?
Gruß, ~~~~ (...)
On Sun, Jun 1, 2008 at 10:57 PM, Andre Karwath aka@aka-online.de wrote:
Hallo,
@Aka: Schön wäre noch, einmal pro Stunde den durchschnittlichen Lag auszurechnen und rauszuschreiben.
das letzte Diagramm auf http://toolserver.org/~aka/cgi-bin/reviewcnt.cgi?lang=german&action=imag...
stellt genau diese sich über die Zeit verändernde Anzahl graphisch dar. Oder meinst du etwas anderes?
Das letzte Diagramm zeigt die Anzahl der Artikel. Was der Troll meinte, ist wohl "Summe der Verzöerung der Sichtung aller dieser Artikel durch die Anzahl dieser Artikel".
Ein plot dessen, was auf der Seite mit http://toolserver.org/~aka/cgi-bin/reviewcnt.cgi?lang=german&action=outo... "Das durchschnittliche Alter der ältesten ungesichteten Versionen beträgt 3 h." gemeint ist. Mathias
2008/6/1 P. Birken pbirken@gmail.com:
Eine Frage die sich mir aufdrängt ist, ob man in Anbetracht dessen, dass das Nachsichten in dieser Form skaliert (und das schon vor der Korrektur für das Vorlagenhandling),
Wenn ich mir http://toolserver.org/~aka/cgi-bin/reviewcnt.cgi?lang=german&action=outo... ansehe (bzw. mehr als nur ansehe, ich habe jetzt mal eine Weile die ältesten Sichtungskadaver entsorgt, sofern ich das beurteilen wollte), bin ich nicht sicher, ob man hier schon so einfach diese Annahme treffen kann.
Die Liste wird tendenziell größer, nicht kleiner. Die durchschnittliche Verweildauer wird größer, nicht kleiner (vorhin waren wir bei 15 Stunden, jetzt sind wir temporär zurück auf 13). Wo und wann müsste die Zahl wie hoch sein, damit man
a) behaupten kann, es skaliere b) behaupten kann, es skaliere nicht
?
Mathias
Mathias Schindler schrob:
Die Liste wird tendenziell größer, nicht kleiner. Die durchschnittliche Verweildauer wird größer, nicht kleiner (vorhin waren wir bei 15 Stunden, jetzt sind wir temporär zurück auf 13). Wo und wann müsste die Zahl wie hoch sein, damit man
a) behaupten kann, es skaliere b) behaupten kann, es skaliere nicht
Naja, man gucke das hier an, wir hatten letztens schon einen ähnlichen Lag: http://toolserver.org/~aka/reviewlag_large.png Ich persönlich stelle mal die Verschwörungstheorie auf, dass die letzte Diskussion (nicht nur auf der Mailingliste) einige Sichter von der Arbeit abgehalten hat, und dass der Lag sich vielleicht demnächst wieder auf ~400 Artikel oder drunter reduzieren könnte. Ist meine optimistische Schätzung.
-- Gruß, V.R.S.
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Und dann gibt es ja noch etliche Benutzer die mit Vorsatz nichtsichten, damit es in dieser Kategorie immer mehr Artikel werden.
Gruß Liesel
2008/6/7 V.R.S. versusray@googlemail.com:
Mathias Schindler schrob:
Die Liste wird tendenziell größer, nicht kleiner. Die durchschnittliche Verweildauer wird größer, nicht kleiner (vorhin waren wir bei 15 Stunden, jetzt sind wir temporär zurück auf 13). Wo und wann müsste die Zahl wie hoch sein, damit man
a) behaupten kann, es skaliere b) behaupten kann, es skaliere nicht
Naja, man gucke das hier an, wir hatten letztens schon einen ähnlichen Lag: http://toolserver.org/~aka/reviewlag_large.png Ich persönlich stelle mal die Verschwörungstheorie auf, dass die letzte Diskussion (nicht nur auf der Mailingliste) einige Sichter von der Arbeit abgehalten hat, und dass der Lag sich vielleicht demnächst wieder auf ~400 Artikel oder drunter reduzieren könnte. Ist meine optimistische Schätzung.
Ich denke mal, dass viele Sichter damit beschäftigt sind, Seiten zum 1. Mal zu sichten. Es wurden in den letzten ca. 40 Tagen ca. 40% der Artikel gesichtet, also ca. 1% pro Tag. Das sind ca. 7700 Sichtungen pro Tag.
reviewcnt sagt, dass es im Moment ca. 1500 Artikel gibt, die nachgesichtet werden müssen.
Daraus folgt, dass, sobald die Erstsichtungen abgeschlossen sind, und die "Sichtungskapazität" für Nachsichtungen verwendet wird, diese 1500 Seiten in ca. 5h /allein durch die momentanen Erstsichter/ abgearbeitet werden könnten.
400 Artikel als langfristige Listenlänge würde ich daher schon eher als pessimistisch einstufen :-)
Magnus
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Akas Diagramme macht eigentlich deutlich, dass wir derzeit noch keine stetige Sichtung der Artikel haben. Auf der einen Seite gibt es mal eine Aktion, wo es einigen wenigen Benutzer gelingt über Nacht o.ä. die Liste abzuarbeiten und auf der anderen Seite wird stundenlang kaum gesichtet, so dass sie wieder anwächst.
Dies macht meiner Meinung nach deutlich, dass es noch zuwenige Sichter gibt bzw. Sichtungen bewusst boykottiert werden um eine schnelle Abschaltung der FR zu erreichen. Wenn jeder im Rahmen der Kontrolle der eigenen Beobachtungsliste gleich die Sichtungen durchführt wäre schon viel gewonnen. Denn Rest können dann die üblichen Freiwilligen erledigen.
Gruß Liesel
Nur so als Idee:
Derzeit haben 3048 Benutzer den Status "Sichter". 460114 Artikel haben noch keine gesichtete Version. Bleiben also für jeden Sichter ca. 150 Artikel zur Erstbesichtigung.
Was haltet ihr davon, alle Artikel, die komplett (d.h. alle Versionen) nur von Sichtern bearbeitet wurden, automatisch als gesichtet einzutragen. Nichts anderes machen wir ja derzeit schon, wenn ein Sichter eine gesichtete Version bearbeitet.
Effekt: Wir kommen schneller an das Ziel einer kompletten Sichtung der Wikipedia, ohne Qualitätsverluste.
Stefan
On Sun, Jun 8, 2008 at 7:49 PM, Stefan Kühn kuehn-s@gmx.net wrote:
Was haltet ihr davon, alle Artikel, die komplett (d.h. alle Versionen) nur von Sichtern bearbeitet wurden, automatisch als gesichtet einzutragen.
Das ist die einfachste Regel, die man noch beliebig verfeinern kann. Edits, die sofort revertiert wurden (von einem Sichter) würden auch dazu fallen.
Kannst du abschätzen, wie viele Artikel es (von den ungesichteten) wären?
Mathias
Mathias Schindler schrieb:
Kannst du abschätzen, wie viele Artikel es (von den ungesichteten) wären?
Nein, da ich mir nie einen Dump mit allen Versionen der Artikel heruntergeladen habe, kann ich nicht sagen wie viele das sein könnten. Aber wenn bei 460114 nur 5% dazu gehören, dann sind das immer noch 23006 Artikel. (Die 5% ist einfach mal ein Tipp ins Blaue!)
Stefan
On Sun, Jun 8, 2008 at 9:25 PM, Stefan Kühn kuehn-s@gmx.net wrote:
Mathias Schindler schrieb:
Kannst du abschätzen, wie viele Artikel es (von den ungesichteten) wären?
Nein, da ich mir nie einen Dump mit allen Versionen der Artikel heruntergeladen habe, kann ich nicht sagen wie viele das sein könnten. Aber wenn bei 460114 nur 5% dazu gehören, dann sind das immer noch 23006 Artikel. (Die 5% ist einfach mal ein Tipp ins Blaue!)
Wenn man irgendwo eine Liste aller Benutzer mit Sichterflag hat, kann man mal aus einer Stichprobe von X Artikeln zusammen mit http://toolserver.org/~daniel/WikiSense/Contributors.php abgleichen, jedenfalls ohne Spezialfälle wie Verschiebeorgien, Revert und so.
Mathias
Mathias Schindler wrote:
On Sun, Jun 8, 2008 at 9:25 PM, Stefan Kühn kuehn-s@gmx.net wrote:
Mathias Schindler schrieb:
Kannst du abschätzen, wie viele Artikel es (von den ungesichteten) wären?
Nein, da ich mir nie einen Dump mit allen Versionen der Artikel heruntergeladen habe, kann ich nicht sagen wie viele das sein könnten. Aber wenn bei 460114 nur 5% dazu gehören, dann sind das immer noch 23006 Artikel. (Die 5% ist einfach mal ein Tipp ins Blaue!)
Wenn man irgendwo eine Liste aller Benutzer mit Sichterflag hat, kann man mal aus einer Stichprobe von X Artikeln zusammen mit http://toolserver.org/~daniel/WikiSense/Contributors.php abgleichen, jedenfalls ohne Spezialfälle wie Verschiebeorgien, Revert und so.
Mathias
Also eine Liste der Sichter gibt es prinzipiell unter http://de.wikipedia.org/w/index.php?title=Spezial%3ABenutzer&username=&a...
Maschinenlesbarer gehts aber über die API: http://de.wikipedia.org/w/api.php?action=query&list=allusers&augroup...
Gruß,
Church of emacs
2008/6/8 church.of.emacs.ml church.of.emacs.ml@googlemail.com:
Mathias Schindler wrote:
On Sun, Jun 8, 2008 at 9:25 PM, Stefan Kühn kuehn-s@gmx.net wrote:
Mathias Schindler schrieb:
Kannst du abschätzen, wie viele Artikel es (von den ungesichteten) wären?
Nein, da ich mir nie einen Dump mit allen Versionen der Artikel heruntergeladen habe, kann ich nicht sagen wie viele das sein könnten. Aber wenn bei 460114 nur 5% dazu gehören, dann sind das immer noch 23006 Artikel. (Die 5% ist einfach mal ein Tipp ins Blaue!)
Wenn man irgendwo eine Liste aller Benutzer mit Sichterflag hat, kann man mal aus einer Stichprobe von X Artikeln zusammen mit http://toolserver.org/~daniel/WikiSense/Contributors.php abgleichen, jedenfalls ohne Spezialfälle wie Verschiebeorgien, Revert und so.
Mathias
Also eine Liste der Sichter gibt es prinzipiell unter http://de.wikipedia.org/w/index.php?title=Spezial%3ABenutzer&username=&a...
Maschinenlesbarer gehts aber über die API: http://de.wikipedia.org/w/api.php?action=query&list=allusers&augroup...
36% aller Artikel sind ausschliesslich von Sichtern verfasst.
Errechnet aus den ersten 500 Artikeln, die mit "N" beginnen.
Magnus
2008/6/9 Magnus Manske magnusmanske@googlemail.com:
2008/6/8 church.of.emacs.ml church.of.emacs.ml@googlemail.com:
Mathias Schindler wrote:
On Sun, Jun 8, 2008 at 9:25 PM, Stefan Kühn kuehn-s@gmx.net wrote:
Mathias Schindler schrieb:
Kannst du abschätzen, wie viele Artikel es (von den ungesichteten) wären?
Nein, da ich mir nie einen Dump mit allen Versionen der Artikel heruntergeladen habe, kann ich nicht sagen wie viele das sein könnten. Aber wenn bei 460114 nur 5% dazu gehören, dann sind das immer noch 23006 Artikel. (Die 5% ist einfach mal ein Tipp ins Blaue!)
Wenn man irgendwo eine Liste aller Benutzer mit Sichterflag hat, kann man mal aus einer Stichprobe von X Artikeln zusammen mit http://toolserver.org/~daniel/WikiSense/Contributors.php abgleichen, jedenfalls ohne Spezialfälle wie Verschiebeorgien, Revert und so.
Mathias
Also eine Liste der Sichter gibt es prinzipiell unter http://de.wikipedia.org/w/index.php?title=Spezial%3ABenutzer&username=&a...
Maschinenlesbarer gehts aber über die API: http://de.wikipedia.org/w/api.php?action=query&list=allusers&augroup...
36% aller Artikel sind ausschliesslich von Sichtern verfasst.
Errechnet aus den ersten 500 Artikeln, die mit "N" beginnen.
Ehm, hier sind auch REDIRECT-Seiten mitgezaehlt...
2008/6/9 Magnus Manske magnusmanske@googlemail.com:
Ehm, hier sind auch REDIRECT-Seiten mitgezaehlt...
Die sich übrigens auch sichten lassen....
Mathias
On Mon, Jun 9, 2008 at 11:08 AM, Mathias Schindler mathias.schindler@gmail.com wrote:
2008/6/9 Magnus Manske magnusmanske@googlemail.com:
Ehm, hier sind auch REDIRECT-Seiten mitgezaehlt...
Die sich übrigens auch sichten lassen....
Ohne REDIRECTs sind es knapp 6%.
Magnus
2008/6/8 Mathias Schindler mathias.schindler@gmail.com:
On Sun, Jun 8, 2008 at 9:25 PM, Stefan Kühn kuehn-s@gmx.net wrote:
Mathias Schindler schrieb:
Kannst du abschätzen, wie viele Artikel es (von den ungesichteten) wären?
Nein, da ich mir nie einen Dump mit allen Versionen der Artikel heruntergeladen habe, kann ich nicht sagen wie viele das sein könnten. Aber wenn bei 460114 nur 5% dazu gehören, dann sind das immer noch 23006 Artikel. (Die 5% ist einfach mal ein Tipp ins Blaue!)
Wenn man irgendwo eine Liste aller Benutzer mit Sichterflag hat
Sowas wie http://de.wikipedia.org/w/index.php?title=Spezial%3ABenutzer&username=&a... ?
Grüsse, Michael