Am Donnerstag, 11. März 2004 17:15 schrieb elwp@gmx.de:
Hallo Ivo, vielen Dank für die Überprüfung meiner Rechnung. Nicht nur Artikel müssen geprüft werden. :-)
Ja, besonders wenn sie komplizierte Beweise enthalten. Nun der war noch recht einfach... :-)
Was passiert, wenn sich die Prüfungen nicht (wie oben angenommen) gleichmäßig auf die Prüfenden verteilen? Dass Ergebniss sollte dann doch besser ausfallen, da die Annahme "jeder prüft einen Artikel nur einmal" wohl richtig ist.
Das ist der einzige Teil deiner E-Mail, den ich leider nicht verstehe. Mag sein, dass das Ergebnis besser wird, wenn ein Benutzer z.B. 300 statt 100 Artikel am Tag prüft. Aber wenn man dabei immer noch sehr weit von der Gesamtzahl der Artikel (1000 pro Tag) entfernt bleibt, bringt das sehr wahrscheinlich auch nicht viel.
Die Annahme war, dass jeder Prüfer P Artikel pro Tag prüft! Kann ja sein, dass ein Prüfer nur 5 und einer 15 prüft. Im Schnitt prüfen sie 10. Und bei Gleichverteilung (wie du angenommen hat) wird das Ergebnis für uns am schlechtesten (wäre also der Worst-Case). Wir brauchen uns also nur um die Zahl der Prüfer und die Gesamtzahl der Prüfungen zu kümmern, um eine Abschätzung zu bekommen.
Problematischer ist die Annahme, dass ein Benutzer den zu prüfenden Artikel völlig zufällig wählt. In der Regel arbeitet er in einem gewissen Zeitfenster. und prüft dann alle Artikel, die gewisse Kriterien besitzen. Das Zeitfenster ist kein Problem. Man kann hier wieder eine Worst-Case-Betrachtung machen. Statt einem Tag, wählt man 10min und betrachet dann die 10min des Tages (der Woche), mit den ungünstigsten Paramtern.
Wenn sich die Benutzer mit ihren Zeitfenstern nicht absprechen, dürfte sich an der Kontroll-Wahrscheinlichkeit nichts ändern. Das bringt mich aber auf die simple
Nein, es kann sein, dass zu einem bestimmtn Zeitfenster viele Nutzer prüfen (immer 12.00 Uhr) zu einem anderen (Nachts um 1.00 Uhr) gar keiner, aber das Verhalten der Schreiber anders ist. Dann wirds problematisch...
Schwierig sind nur die Kriterien. Ich geh in der Liste der neuen Artikel alle besonder kurzen Artikel durch, wenn ich mal Bock drauf hab. Dann fliegen vor allem Artikel raus, die zu wenig Inhalt besitzen. URVs finde ich damit aber keine.
Ja, die kurzen Artikel sehe ich mir auch meistens an. Gerade bei denen gibt es vermutlich die meisten Überschneidungen, und umso weniger werden die anderen Artikel geprüft.
Wir sollten die Parameter mittels Umfragen mal von Zeit zu Zeit überprüfen und ausrechnen wie schlecht oder gut wir in welchem Bereich (im schlimmsten Fall) sind.
Mir ist nicht ganz klar, was du hier mit "Umfrage" meinst.
Man wähle 200 aktive Nutzer zufällig aus und frage sie nach gewissen Verhaltensmustern aus. Danach lassen sich die nötigen Parameter (A, B, P) extrahieren...
Was man einfach machen könnte, sind Stichproben: Man wählt zufällig z.B. 100 Artikel aus und bewertet sie nach Kriterien wie: vandalisiert, wikifiziert etc. Falls die
Nee, so meinte ich dass nicht...
Aufgabenverteilung nach der Uhrzeit der Artikelerstellung realisiert werden sollte, könnte man auch später prüfen, welche Qualität die zu den unterschiedlichen Uhrzeiten angelegten Artikel haben und dann entsprechend die Verteilung der Prüfer auf die Zeiträume neu gewichten.
Im Grunde läuft deine Idee auf dem von mir schon vor langer Zeit vorgeschlagenen Reviewers-Mode hinaus. Man klickt auf einen Button "Review" und bekommt einen ungeprüfen Artikel vorgesetzt, den man prüfen, bewerten, verbessern kann. Das System entscheidet dann, welchen Artikel es aufgrund der Bewertung nochmal jemand anderem Vorsetzen muss, am besten nach dessen vorlieben...
Ich hätte nichts dagegen, ein solches System einzuführen. Aber dafür müsste man vermutlich eine ganze Menge programmieren, und das dauert bekanntlich, falls überhaupt jemand bereit ist, diese Aufgabe zu übernehmen und die Idee nicht wieder zerredet wird ("schon wieder so ein Sifter-artiger Vorschlag").
Man muss aber am vorhandenen Code nicht viel ändern. Die Änderungen werden sowieso mitgelogged und zusätzlich merken müssten man sich nur die Berwertungen der Prüfer...
Aus einem Pool von Artikeln zufällig was auswählen, ist ja nicht schwer...
--Ivo Köthnig