Mal wieder ein kleines Update der Anzahl der Bearbeitungen (Kleine Unterschiede zu den Zahlen, die ich vorher gepostet hatte, sind auf Seitenlöschungen zurückzuführen.):
20040229 6772 20040301 8601 20040302 11090 20040303 10733 20040304 11534 20040305 12356 20040306 13238 20040307 14497 20040308 14093
So viele Bearbeitungen kann niemand mehr überblicken. Wenn man sich die neuen Seiten ansieht, von denen ja momentan täglich etwa 1000 kommen, ist klar, dass wir mit dem Überprüfen und Wikifizieren nicht mehr nachkommen. Ich weiß auch nicht, ob die Aktivität so hoch bleiben wird, aber ich schätze, dass sie im Schnitt permanent über 6000 bleiben wird, was immer noch eine Verdoppelung gegenüber dem Zustand vor einem Monat wäre.
Ich finde diese Situation sehr unbefriedigend und teils auch frustrierend. Deswegen schlage ich einen neuen Kontroll-Mechanismus vor, der nur eine geringfügige Modifkation der Software erfordert. Allerdings müssten sich genügend erfahrene Benutzer bereit erklären, dabei mitzumachen.
Die Idee ist, dass nicht mehr jeder Benutzer alle neuen Seiten und Seitenbearbeitungen vorgesetzt bekommt, sondern nur noch einen Teil. Welcher Teil das ist, kann er selbst bestimmen (und dabei auch "alles" auswählen, was dem bisherigen Verhalten entspricht).
Umsetzung: Die cur-Tabelle enthält bereits ein Feld mit einer Zufallszahl zwischen 0 und 1. Dieses müsste man auch in die recentchanges-Tabelle übernehmen. Jeder Benutzer soll dann in seinen Einstellungen bestimmen können, dass nur Bearbeitungen mit einer Zufallszahl in einem Bereich angezeigt werden, dessen Grenzen er frei bestimmen kann.
Zusätzlich könnte man auf einer Seite im Wiki eine Liste anlegen, z.B. mit den Punkten *0-0.1 *0.1-0.2 etc. hinter denen sich dann jeder einträgt, der diesen Bereich beobachtet. Die Liste ist ganz flexibel. Feinere Unterteilungen wären jederzeit ohne Änderung der Software möglich.
Wahrscheinlich wäre es am sinnvollsten, in den letzten Änderungen neben dem ausgewählten Bereich auch alle Seiten der Beobachtungsliste und alle Seiten in besonderen Namensräumen (Wikipedia, MediaWiki & zugehörige Diskussionsseiten) anzuzeigen. Auch müsste man leicht zwischen "allen letzten Änderungen" bzw. "allen neuen Artikeln" und der Auswahl umschalten können.
Ich würde evtl. versuchen, etwas in dieser Richtung zu programmieren, falls genug Leute sich vorstellen könnten, dieses System zu nutzen. (Wenn ich der einzige bin, der sich einen Bereich herauspickt, macht das wenig Sinn.)
El
elwp@gmx.de wrote:
So viele Bearbeitungen kann niemand mehr überblicken. [...] Ich finde diese Situation sehr unbefriedigend und teils auch frustrierend. Deswegen schlage ich einen neuen Kontroll-Mechanismus vor [...]
Ein interessanter Vorschlag, ich glaube aber, dass sich auch dieses Thema eleganz erledigen wird, wenn wir Kategorien haben. Dann liesse sich nämlich ein (m.E. sinnvollerer, da inhaltsbasierter) Selektionsmechanismus bauen, z.B. dass einem dann angezeigt werden:
(a) alle neuen Artikel [Änderungen], (b) nur die neuen Artikel [Änderungen] in einer bestimmten oder eine begrenzten Anzahl von Kategorie(n) oder (c) alle neuen Artikel [Änderungen] ohne Kategorie
Das würde die Flut ganz erheblich eingrenzen und das Abarbeiten neuer Einträge erheblich stringenter machen; mir wäre das jedenfalls sympathischer als ein zufallsbasierter Mechanismus.
Leider habe ich keine Ahnung, ob und wann wir mit der Einführung von Kategorien rechnen können :-( Als ich zuletzt nachgeschaut hatte, war leider sogar gerade ein Vorschlag abgelehnt worden, eine Roadmap für die Weiterentwicklung von Mediawiki einzuführen.
BTW: Wie läuft das eigentlich in der englischsprachigen Wikipedia? Die haben ja sicherlich mehr als 1k neue Seiten pro Tag?
MfG -asb
Agon:
elwp@gmx.de wrote:
So viele Bearbeitungen kann niemand mehr überblicken. [...] Ich finde diese Situation sehr unbefriedigend und teils auch frustrierend. Deswegen schlage ich einen neuen Kontroll-Mechanismus vor [...]
Ein interessanter Vorschlag, ich glaube aber, dass sich auch dieses Thema eleganz erledigen wird, wenn wir Kategorien haben. Dann liesse sich nämlich ein (m.E. sinnvollerer, da inhaltsbasierter) Selektionsmechanismus bauen, z.B. dass einem dann angezeigt werden:
(a) alle neuen Artikel [Änderungen], (b) nur die neuen Artikel [Änderungen] in einer bestimmten oder eine begrenzten Anzahl von Kategorie(n) oder (c) alle neuen Artikel [Änderungen] ohne Kategorie
Das würde die Flut ganz erheblich eingrenzen und das Abarbeiten neuer Einträge erheblich stringenter machen; mir wäre das jedenfalls sympathischer als ein zufallsbasierter Mechanismus.
Einteilung nach Kategorien ist auch sinnvoll. Ich befürchte nur, dass die meisten neuen Artikel ohne Kategorie angelegt werden, womit man wieder beim alten Problem wäre. Ein weiteres Problem ist, dass es vermutlich noch sehr lange dauern wird, bis auch alle alten Artikel kategorisiert sind. Es wäre kein Problem, beide Einteilungsoptionen gleichzeitig anzubieten.
BTW: Wie läuft das eigentlich in der englischsprachigen Wikipedia? Die haben ja sicherlich mehr als 1k neue Seiten pro Tag?
Momentan haben sie ca. 700 neue Artikel pro Tag. Ich weiß nicht, wie die das dort machen, aber softwaregestützt kann es nicht sein, weil ja überall die gleiche Software verwendet wird.
Ich hatte mir früher schon mal eine Lösung für die neuen Artikel überlegt, die ohne irgendwelche Softwareänderungen auskommt: Man legt einfach eine Seite mit Links auf neue Artikel an, die man vielleicht ein- oder zweimal am Tag auffüllt. Benutzer, die einige neue Seiten überprüfen wollen, entfernen dann einfach einen Block von dieser Links. So vermeidet man, dass einige Artikel von mehreren angesehen werden, und andere von niemandem. Wenn wir das so machen würden, wäre es mir auch recht. Der Nachteil ist nur, dass immer jemand die neuen Seiten ergänzen muss, und eine Lösung für die Flut auf der Letzte-Änderungen-Seite ist es auch nicht.
El
elwp@gmx.de writes:
Einteilung nach Kategorien ist auch sinnvoll. Ich befürchte nur, dass die meisten neuen Artikel ohne Kategorie angelegt werden, womit man wieder beim alten Problem wäre. Ein weiteres Problem ist, dass es vermutlich noch sehr lange dauern wird, bis auch alle alten Artikel kategorisiert sind. Es wäre kein Problem, beide Einteilungsoptionen gleichzeitig anzubieten.
Das ist wieder mein Lieblingsthema. Ohne Kategorisierung wird es keinen Überblick und keine effektive Qualitätssicherung geben. Da gibt es aber (mindestens) zwei Probleme:
1. Es gibt keine obligatorische, d.h. von der Software erzwungene Klassifizierung von Artikeln bei deren Kreation. Ich stelle mir das so vor, daß vor dem Klick auf Abspeichern eine Auswahlliste der akzeptierten Fachgebiete angesteuert werden muß und ein Fachgebiet ausgewählt werden muß. Sonst wird nicht gespeichert. Wenn man das hätte, könnte man die sehr erwünschten einfachen Linklisten zu jedem Fachgebiet automatisch generieren und dann auch damit arbeiten.
2, Es gibt kein Konzept, was als Fachgebiet (Kategorie) gelten soll. Das Sammelsurium, was auf der [[Liste der Fachgebiete]] steht, kann's ja nicht sein.
Die Zahl der "Fachgebiete" sollte sehr begrenzt sein, vielleicht in Anlehnung an Schulfächer (Geschichte, Erkunde, Physik, Chemie, Biologie, Informatik, Philosophie, Musik, Kunst usw.) und dazu vielleicht noch Literatur, Alltag, Recht, Astronomie, Pop und Entertainment). Vielleicht noch das ein oder andere, aber jedenfalls möglichst umfassende Oberbegriffe (also nicht z.B. Computerspiele, Filmschauspieler, Kreolsprachen, Raumfahrt o.ä., auch nicht Querschnittsfächer oder Spezialfächer wie Mediävistik oder Gentechnologie).
3. Was die Nachkategorisierung alter Artikel angeht. Ich habe gerade ein einsames Projekt zur Nachkategorisierung aller Artikel zum Altertum gestartet ([[Wikipedia:Wikiprojekt Altertumswissenschaft]]) und mache ganz gute Fortschritte. Die bisher vorhandenen (etwa 4000) Artikel zum Altertum habe ich zusammengesammelt, soweit ich sie bisher identifizieren konnte, und bin jetzt dabei, das feiner zu gliedern. Neue Artikel füge ich nach Möglichkeit täglich hinzu (etwa 15 - 20 pro Tag). Ich fürchte, "man" wird das für alle zukünftigen Kategorien nachholöen müssen. Also je eher es softwäremäßig erzwungene Kategorien gibt, um so besser.
Denke ich - Michael.
Michael Wagner wrote:
Die Zahl der "Fachgebiete" sollte sehr begrenzt sein, vielleicht in Anlehnung an Schulfächer (Geschichte, Erkunde, Physik, Chemie, Biologie, Informatik, Philosophie, Musik, Kunst usw.) und dazu vielleicht noch Literatur, Alltag, Recht, Astronomie, Pop und Entertainment).
Hallo Michael, hallo Leute, Ich denke auch, dass die Zahhl der Fachgebiete irgendwie begrenzt sein sollte, Schulfächer scheinen mir aber eher ungeeignet. So ist Erdkunde z.B eine merkwürdige Mischung aus Soziologie und Geologie. Vielleicht taugen die Portale und WikiProjekte als Startpunkt für Kategorien? Gibt es eine Seite, auf der wir Kategorien vorbereiten und diskutieren können?
Gruß, Joachim
elwp@gmx.de wrote:
Ich hatte mir früher schon mal eine Lösung für die neuen Artikel überlegt, die ohne irgendwelche Softwareänderungen auskommt:
Interessante Lösung. Welches Problem löst sie denn? ;-)
[über die englischsprachige Wikipedia]
Momentan haben sie ca. 700 neue Artikel pro Tag. Ich weiß nicht, wie die das dort machen, aber softwaregestützt kann es nicht sein, weil ja überall die gleiche Software verwendet wird.
Wie wir was machen? Neue Artikel beobachten?
Ist schon komisch, daß ihr offenbar alle der Ansicht seid, daß das überhaupt nötig ist, bzw. daß es ein Problem darstellt. Es stimmt zwar, daß vielleicht mal gerade keiner auf Special:Newpages guckt und eine neuerstellte Müllseite da mal durchrutscht, aber das heißt ja nicht, daß sie für immer bleibt. Früher oder später wird sie gefunden (z.B. indem jemand nach Orphans oder Dead-Ends sucht, oder in einem anderen Artikel einen Link setzt und feststellt, daß er zu einer Müllseite führt, etc.). Solange diese Seiten Orphans sind, kann ja auch ein beiläufiger Besucher nicht darauf stoßen, also stellen sie keinerlei Schwierigkeit dar. Und wenn sie keine Orphans sind, erhöht das die Wahrscheinlichkeit, daß jemand drauf stößt und sich drum kümmert.
Timwi
Ist schon komisch, daß ihr offenbar alle der Ansicht seid, daß das überhaupt nötig ist, bzw. daß es ein Problem darstellt. Es stimmt zwar, daß vielleicht mal gerade keiner auf Special:Newpages guckt und eine neuerstellte Müllseite da mal durchrutscht, aber das heißt ja nicht, daß sie für immer bleibt. Früher oder später wird sie gefunden
Eher später als früher
(z.B. indem
jemand nach Orphans oder Dead-Ends sucht, oder in einem anderen Artikel einen Link setzt und feststellt, daß er zu einer Müllseite führt, etc.). Solange diese Seiten Orphans sind, kann ja auch ein beiläufiger Besucher nicht darauf stoßen, also stellen sie keinerlei Schwierigkeit dar.
Doch - er kann sie beim Suchen finden. Benutzer *surfen* nicht durch eine Enzyklopädie, Benutzer *suchen nach Stichworten*. Damit stellen diese Seiten eine Schwierigkeit dar
wenn sie keine Orphans sind, erhöht das die Wahrscheinlichkeit, daß jemand drauf stößt und sich drum kümmert.
Es erhöht auch die Wahrscheinlichkeit, dass uns jemand für komplett bescheuert hält, weil wir so einen Unsinn bei uns stehen haben.
Kurz gesagt: Was durchrutscht, ist in der Tiefsee der WP lange Zeit verschollen, und wenn's irgendwann aufschwimmt, dann ist die Wahrscheinlichkeit recht groß, dass es dabei unangenehm stinkt. Das sollten wir vermeiden.
Uli
Timwi:
elwp@gmx.de wrote:
Ich hatte mir früher schon mal eine Lösung für die neuen Artikel überlegt, die ohne irgendwelche Softwareänderungen auskommt:
Interessante Lösung. Welches Problem löst sie denn? ;-)
Das hatte ich bereits geschrieben: Einige neue Seiten werden mehrfach geprüft, andere offenbar überhaupt nicht. Das kann man effizienter machen, indem man die Arbeit irgendwie aufteilt.
[über die englischsprachige Wikipedia]
Momentan haben sie ca. 700 neue Artikel pro Tag. Ich weiß nicht, wie die das dort machen, aber softwaregestützt kann es nicht sein, weil ja überall die gleiche Software verwendet wird.
Wie wir was machen? Neue Artikel beobachten?
Ist schon komisch, daß ihr offenbar alle der Ansicht seid, daß das überhaupt nötig ist, bzw. daß es ein Problem darstellt.
Ich weiß nicht, wozu du in der Wikipedia arbeitest. Mein Ziel ist jedenfalls, die Qualität der Artikel zu erhöhen. Bezweifelst du ernsthaft, dass es bei den meisten neuen Artikeln erhebliche Qualitätsdefizite gibt?
Es stimmt zwar, daß vielleicht mal gerade keiner auf Special:Newpages guckt und eine neuerstellte Müllseite da mal durchrutscht, aber das heißt ja nicht, daß sie für immer bleibt. Früher oder später wird sie gefunden (z.B. indem jemand nach Orphans oder Dead-Ends sucht, oder in einem anderen Artikel einen Link setzt und feststellt, daß er zu einer Müllseite führt, etc.).
Wenn ich mich darauf verlassen will, dass früher oder später irgendjemand alles richten wird, kann ich mich gleich zurücklehnen und Däumchen drehen.
Solange diese Seiten Orphans sind, kann ja auch ein beiläufiger Besucher nicht darauf stoßen, also stellen sie keinerlei Schwierigkeit dar. Und wenn sie keine Orphans sind, erhöht das die Wahrscheinlichkeit, daß jemand drauf stößt und sich drum kümmert.
Bevor jemand, der zufällig auf einen Müllartikel stößt, diesen verbessert, werden zig andere Leute ein ziemlich schlechtes Bild von der Wikipedia bekommen. Man kann das dadurch verhindern, dass die Artikel von Anfang an gewisse Mindestanforderungen erfüllen. Außerdem ist es besser, wenn die neuen Autoren von Anfang an einen Eindruck bekommen, wie man einen Artikel gut schreibt. Und ich vermute, vielen ist es auch lieber, wenn ihre Werke schnell in eine gute Form gebracht werden, als wenn sie erstmal links liegen gelassen werden und langsam vor sich hin schimmeln.
El
elwp@gmx.de wrote:
Ich weiß nicht, wozu du in der Wikipedia arbeitest. Mein Ziel ist jedenfalls, die Qualität der Artikel zu erhöhen. Bezweifelst du ernsthaft, dass es bei den meisten neuen Artikeln erhebliche Qualitätsdefizite gibt?
Nein, das bezweifle ich natürlich nicht. Eher ganz im Gegenteil: Seit einigen Tagen gucke ich durchaus mal bei Special:Newpages vorbei und sehe da oft neue Artikel, deren Qualität zu wünschen übrig läßt.
Aber darum geht es mir ja gar nicht. Ich finde es nur interessant, zu beobachten, daß ihr hier in der deutschen Wikipedia so viel mehr Wert darauf legt, alle Neueinträge zu kontrollieren. Bei euch liegt irgendwie der Fokus ganz woanders...
Wenn ich mich darauf verlassen will, dass früher oder später irgendjemand alles richten wird, kann ich mich gleich zurücklehnen und Däumchen drehen.
Diese Einstellung ist natürlich lobenswert, weil sie dich dazu animiert, die neu angelegten Artikel zu verbessern. Also nur zu!
Aber es ist doch trotzdem interessant, zu beobachten, daß die englischsprachige Wikipedia funktioniert, obwohl diese Einstellung da (offenbar) nicht ganz so prävalent ist. Einige von ihnen haben halt Lust, Artikel aufzupolieren, andere (wie ich) nicht. :)
Bevor jemand, der zufällig auf einen Müllartikel stößt, diesen verbessert, werden zig andere Leute ein ziemlich schlechtes Bild von der Wikipedia bekommen. Man kann das dadurch verhindern, dass die Artikel von Anfang an gewisse Mindestanforderungen erfüllen.
Ein durchaus nachvollziehbarer Gesichtspunkt. Ulrich hat ja auch genau das gleiche gesagt (da fällt es echt schwer, es sich zu verkneifen, auf das deutsche Volk zu verallgemeinern ;-) ).
Ich weiß aber wohl, daß zumindest ich nicht so reagieren würde. Ich würde nicht von einem schlechten Artikel auf eine schlechte Qualität der gesamten Webseite schließen. Das habe ich auch nicht, als ich das erste Mal auf Wikipedia stieß. Ist das vielleicht beim allgemeinen deutschen Volk anders? ;-)
Außerdem ist es besser, wenn die neuen Autoren von Anfang an einen Eindruck bekommen, wie man einen Artikel gut schreibt.
Hm. Dabei gehst du offenbar davon aus, daß die Leute nach einiger Zeit ihren Artikel nochmal besuchen. Das halte ich für eher unwahrscheinlich. Leute, die Artikel schlechter Qualität hinterlassen, sind doch im allgemeinen Leute, die von Wikipedia keine Ahnung haben. Sie rechnen also auch nicht damit, daß Inhalte sich schnell ändern können, weil sie von Anderen bearbeitet werden. Ganz im Gegenteil, sie sind davon vielleicht eher verwirrt. Ich war es jedenfalls, als ich noch ganz neu war. :)
Naja. Ich hoffe, daß ich nicht wieder rüberkam wie ein argumentativer Schnösel. Ich find's halt nur interessant.
Timwi
Timwi timwi@gmx.net writes:
Wie wir was machen? Neue Artikel beobachten?
Das habe ich mich auch gefragt :)
Ist schon komisch, daß ihr offenbar alle der Ansicht seid, daß das überhaupt nötig ist, bzw. daß es ein Problem darstellt.
Das wundert mich auch. Vor allen Dingen ist eigenartig, daß Viele glauben, "früher" wäre es besser gewesen. Dabei sind eigentlich bestimmt noch immer 90% der "früher" angelegten Artikel zwar nicht falsch, aber im Grunde herzlich schlecht - davon möchte ich "meine" Artikel keineswegs ausnehmen.
Der Ruf nach Bürokratie ist erstaunlich. Es scheinen bereits alle Chaostheorien wieder vergessen zu sein.
Früher oder später wird sie gefunden
Ja, so ungefähr. Solange etwas nicht grob sittenwidrig ist, sind auch "Müllseiten" nicht problematisch - kein Grund, deswegen die Adminkeule zu schwingen.
Allerdings wäre viel Wildwuchs schnell durch XML/SGML zu kanalisieren. Ohne XML/SGML werden alle Räder neu erfunden werden.
On Tuesday 09 March 2004 20:13, Karl Eichwalder wrote:
Das wundert mich auch. Vor allen Dingen ist eigenartig, daß Viele glauben, "früher" wäre es besser gewesen. [...]
Meiner Meinung nach skaliert das System der Wikipedia ziemlich gut. Ich sehe daher keinen Grund die Struktur zu erweitern oder gar völlig umzukrempeln. Nur lässt sich die Effizienz noch etwas steigern: wie hier etwa schon richtig angemerkt wurde, macht es bei einer Überlastung der Admins keinen Sinn, wenn dann auch noch 2-3 erfahrene Leute denselben Artikel überprüfen - dies ist eine Verschwendung von Resourcen.
Erik Möller(?) hatte vor einigen Wochen auf wiki-tech vorgeschlagen eine checkbox auf jede neue Seite legen, die ein Admin aktivieren kann und damit in der "new articles" Liste signalisiert, dass der betreffende Artikel schon überprüft wurde. Wer so etwas implementieren will, wird damit bestimmt auf wiki-tech auf offene Ohren treffen.
Nebenbei sei bemerkt, dass wir das Glück haben durch einen Blick nach en.wikipedia.org quasi 6-12 Monate in die Zukunft zu schauen und die sieht verdammt gut aus :-)
Ach ja, eines fehlt mir in der Admin Diskussion: ein ganz großes Dankeschön an euch, die ihr euch Stunden, Tage, Nächte und Wochenende um die Ohren schlagt, um diesen bestimmt nicht immer dankbaren Job auszufüllen! Also weiter so und vielen, vielen Dank!
Beste Grüße, Marco
Marco Krohn marco.krohn@web.de writes:
Nur lässt sich die Effizienz noch etwas steigern: wie hier etwa schon richtig angemerkt wurde, macht es bei einer Überlastung der Admins keinen Sinn, wenn dann auch noch 2-3 erfahrene Leute denselben Artikel überprüfen - dies ist eine Verschwendung von Resourcen.
a) Solange wir (incl. Admins) nicht wirklich gut sind, ist es durchaus okay, wenn mehr als 3 Leute einen Artikel prüfen.
b) Nicht nur Admins überprüfen Artikel.
c) Gerade Artikel von Admins müssen überprüft werden ;)
d) Ein Admin überprüfe solange Artikel, wie er Lust hat. Den Rest erledigt dann jemand anderes.
Ach ja, eines fehlt mir in der Admin Diskussion: ein ganz großes Dankeschön an euch, die ihr euch Stunden, Tage, Nächte und Wochenende um die Ohren schlagt, um diesen bestimmt nicht immer dankbaren Job auszufüllen! Also weiter so und vielen, vielen Dank!
So etwas ist eher bedenklich - und einige scheinen auch schon "abgestürzt" zu sein. Vergeßt die Pausen nicht!
Ulrich Fuchs mail@ulrich-fuchs.de writes:
Allerdings wäre viel Wildwuchs schnell durch XML/SGML zu kanalisieren. Ohne XML/SGML werden alle Räder neu erfunden werden.
ceterum censeo XML esse utilisandam, oder was?
Sicher. Steter Tropfen. Kennt eigentlich jemand ein Wiki, das auf XML als Markup-Sprache aufsetzt?
Kennt eigentlich jemand ein Wiki, das auf XML als Markup-Sprache aufsetzt?
Oops, nein, sorry, ist doch "nur" XHTML 1.0 :-(
On Wednesday 10 March 2004 06:41, Karl Eichwalder wrote:
Marco Krohn marco.krohn@web.de writes:
Nur lässt sich die Effizienz noch etwas steigern: wie hier etwa schon richtig angemerkt wurde, macht es bei einer Überlastung der Admins keinen Sinn, wenn dann auch noch 2-3 erfahrene Leute denselben Artikel überprüfen - dies ist eine Verschwendung von Resourcen.
a) Solange wir (incl. Admins) nicht wirklich gut sind, ist es durchaus okay, wenn mehr als 3 Leute einen Artikel prüfen.
Das habe ich auch nicht bestritten. Natürlich ist es noch besser wenn 20 Personen einen Artikel prüfen, nur ist diese Aussage nur für unbegrenzte Resourcen gültig.
Für die begrenzten Resourcen, die uns leider zur Verfügung stehen würde ich es bevorzugen, wenn 3 neue Artikel mindestens einmal durchgesehen werden, anstatt dass einer von dreien bearbeitet und zwei neue Artikel gar nicht geprüft werden.
Die Aussage, dass die Admins nicht wirklich gut sind (was ich mal dahingehend verstehe, dass auch ein Admin nicht perfekt ist), mag richtig sein, aber doch hätte jeder Admin einen Artikel wie "Kleinkind" mindestens kurz überarbeitet.
http://de.wikipedia.org/wiki/Kleinkind
b) Nicht nur Admins überprüfen Artikel.
auch das ist kein Gegenargument. Wenn die von Admins geprüften Artikel in der Liste "neue Artikel" markiert werden, dann sinkt einfach die Wahrscheinlichkeit, dass ein Artikel überhaupt nicht geprüft wird. Das hat gar nichts damit zu tun, ob auch nicht-Admins einen Artikel überprüfen.
c) Gerade Artikel von Admins müssen überprüft werden ;)
Ist ja auch richtig, aber geht nicht auf meinen Punkt ein. Ich als Nutzer habe bspw. sehr viel davon gelernt, dass meine ersten Gehversuche in der Wikipedia schnell überarbeitet wurden. Da habe ich dann gesehen, wie die Wiki-Syntax wirklich funktioniert. Der Autor von "Kleinkind" wird diese schöne Erfahrung wohl leider nicht machen :-(
d) Ein Admin überprüfe solange Artikel, wie er Lust hat. Den Rest erledigt dann jemand anderes.
O.k. wir schreiben offensichtlich aneinander vorbei ;-)
Ich gebe zu, dass ich meine Position in der vorhergehenden mail nicht besonders gut klar gemacht habe, daher hier die Kurzfassung:
1. jeder neue Artikel sollte min. einmal kurz von einem erfahrenen Nutzer (z.b. Admin) überprüft werden. 2. die jetzige Method ist nicht effizient, dahingehend, dass einfache Änderungen an der Software Punkt (1) wesentlich besser gewährleisten könnten.
Viele Grüße, Marco
Marco:
Meiner Meinung nach skaliert das System der Wikipedia ziemlich gut. Ich sehe daher keinen Grund die Struktur zu erweitern oder gar völlig umzukrempeln. Nur lässt sich die Effizienz noch etwas steigern: wie hier etwa schon richtig angemerkt wurde, macht es bei einer Überlastung der Admins keinen Sinn, wenn dann auch noch 2-3 erfahrene Leute denselben Artikel überprüfen - dies ist eine Verschwendung von Resourcen.
Ich habe ausgerechnet, ob die Möglichkeit der Artikelkontrolle tatsächlich mit der Größe der Wikipedia skaliert:
Zuerst ein paar Definitionen: A: Anzahl der pro Tag zu prüfenden Artikel B: Anzahl der Benutzer, die die Artikel prüfen P: Anzahl der Prüfungen pro Benutzer und Tag
Dann gibt N=BP/A an, wie oft ein Artikel im Mittel geprüft wird.
Annahme: Kein Benutzer prüft Artikel mehrfach und wählt unabhängig von den anderen Benutzern die Artikel, die er prüft, zufällig aus.
Die Wahrscheinlichkeit w für einen Artikel, von keinem Benutzer geprüft zu werden ist:
w = X^N mit X=(1-P/A)^(A/P)
Um w möglichst klein zu halten, sollte auch X möglichst klein sein. Für den Genzfall A/P->unendlich ist X=1/e. Schlimmer kann es nicht werden. Wenn man sich im Bereich A>>P befindet (so wie jetzt: A=1000, B=100 (geschätzt)), kann man also sagen, dass die Funktionsweise der Wikipedia perfekt mit der Aktivität skaliert. Nur ist diese Funktionsweise wenig effektiv: Wenn ein Artikel im Schnitt von 2 Benutzern geprüft wird, werden ca. 14% der Artikel von niemandem geprüft. Bei N=3 ist immer noch w=5%. Dieses Gießkannenprinzip funktioniert zwar irgendwie, aber besonders intelligent finde ich es nicht. Wir haben den Bereich A>>P auch erst in den letzten Monaten erreicht. Vorher war die Möglichkeit, effizient zu kontrollieren, erheblich besser (d.h. X war viel kleiner).
Der Vorschlag, den ich gemacht hatte, läuft darauf hinaus, das Verhältnis A/P möglichst klein zu halten. Im optimalen Fall A/P=1 wird X=0 und damit w=0.
Erik Möller(?) hatte vor einigen Wochen auf wiki-tech vorgeschlagen eine checkbox auf jede neue Seite legen, die ein Admin aktivieren kann und damit in der "new articles" Liste signalisiert, dass der betreffende Artikel schon überprüft wurde. Wer so etwas implementieren will, wird damit bestimmt auf wiki-tech auf offene Ohren treffen.
Ein solcher Mechanismus wäre auch nicht schlecht, sollte aber nicht an den Adminstatus gebunden sein. Andererseits macht es auch wenig Sinn, jedem eine solche Bewertung zu ermöglichen. Man bräuchte einen neuen Status wie "erfahrener Benutzer" o.ä., was alles wieder ziemlich kompliziert machen würde.
El
Ich habe ausgerechnet, ob die Möglichkeit der Artikelkontrolle tatsächlich mit der Größe der Wikipedia skaliert:
Zuerst ein paar Definitionen: A: Anzahl der pro Tag zu prüfenden Artikel B: Anzahl der Benutzer, die die Artikel prüfen P: Anzahl der Prüfungen pro Benutzer und Tag
Dann gibt N=BP/A an, wie oft ein Artikel im Mittel geprüft wird.
Annahme: Kein Benutzer prüft Artikel mehrfach und wählt unabhängig von den anderen Benutzern die Artikel, die er prüft, zufällig aus.
Die Wahrscheinlichkeit w für einen Artikel, von keinem Benutzer geprüft zu werden ist:
w = X^N mit X=(1-P/A)^(A/P)
Zum Verständnis: 1-P/A ist die Wahrscheinlichkeit, dass ein ganz bestimmter Benutzer einen ganz bestimmten Artikel nicht prüft. w=(1-P/A)^B ist die Wahrscheinlichkeit, dass kein Benutzer den Artikel prüft. Mit N*(A/P)=B stimmt also die Behauptung von el.
Um w möglichst klein zu halten, sollte auch X möglichst klein sein. Für den Genzfall A/P->unendlich ist X=1/e. ...
Zur Erläuterung: die eulersche Zahl e=2,71... lässt sich genau durch den Grenzwert
lim (1-1/x)^x = 1/e x->inf.
definieren.
... Schlimmer kann es nicht werden. Wenn man sich im Bereich A>>P befindet (so wie jetzt: A=1000, B=100 (geschätzt)), kann man also sagen, dass die Funktionsweise der Wikipedia perfekt mit der Aktivität skaliert. Nur ist diese Funktionsweise wenig effektiv: Wenn ein Artikel im Schnitt von 2 Benutzern geprüft wird, werden ca. 14% der Artikel von niemandem geprüft. Bei N=3 ist immer noch w=5%. Dieses Gießkannenprinzip funktioniert zwar irgendwie, aber besonders intelligent finde ich es nicht.
Ich finde es immerhin recht genial, dass man (unter obigen Annahmen) ausrechnen kann, wieviele Artikel ungeprüft bleiben.
Was passiert, wenn sich die Prüfungen nicht (wie oben angenommen) gleichmäßig auf die Prüfenden verteilen? Dass Ergebniss sollte dann doch besser ausfallen, da die Annahme "jeder prüft einen Artikel nur einmal" wohl richtig ist.
Problematischer ist die Annahme, dass ein Benutzer den zu prüfenden Artikel völlig zufällig wählt. In der Regel arbeitet er in einem gewissen Zeitfenster. und prüft dann alle Artikel, die gewisse Kriterien besitzen. Das Zeitfenster ist kein Problem. Man kann hier wieder eine Worst-Case-Betrachtung machen. Statt einem Tag, wählt man 10min und betrachet dann die 10min des Tages (der Woche), mit den ungünstigsten Paramtern.
Schwierig sind nur die Kriterien. Ich geh in der Liste der neuen Artikel alle besonder kurzen Artikel durch, wenn ich mal Bock drauf hab. Dann fliegen vor allem Artikel raus, die zu wenig Inhalt besitzen. URVs finde ich damit aber keine.
D.h., man muss die Betrachtungen für jede Sorte von Fehlerquelle durchführen. Dann kann man sagen, so und so viel Prozent der Artikel sind nicht auf dieses oder jenes Kriterium geprüft worden.
Wir sollten die Parameter mittels Umfragen mal von Zeit zu Zeit überprüfen und ausrechnen wie schlecht oder gut wir in welchem Bereich (im schlimmsten Fall) sind.
Dann können wir auch bessere Maßnamen abstimmen, um die Qualität zu erhöhen. Nicht zu letzt gibt uns dass auch ein Argument gegen Brockhaus und Co in die Hand. Wenn mit mathematischen Methoden nachrechnen, wie gut wir sind, fällt es denen schwerer Einspruch zu erheben.
Wir haben den Bereich A>>P auch erst in den letzten Monaten erreicht. Vorher war die Möglichkeit, effizient zu kontrollieren, erheblich besser (d.h. X war viel kleiner).
Der Vorschlag, den ich gemacht hatte, läuft darauf hinaus, das Verhältnis A/P möglichst klein zu halten. Im optimalen Fall A/P=1 wird X=0 und damit w=0.
Zur Erläuterung: A/P wird dadurch klein, dass sich die Prüfer abstimmen. Wenn sich zwei Prüfer abstimmen und nur Artikel prüfen, die der andere nicht prüft, kann man sie nach diesem Modell als ein Prüfer betrachten, die doppelt so viele Artikel prüfen (lässt sich nat. auch auf mehere Prüfer verallgemeinern).
Der bestmögliche Fall tritt dann ein, wenn sich alle Prüfer zu einem Prüfer zusammenschließen. Er wird otimal, wenn dieser eine Prüfer alle Artikel prüfen kann. Logisch, darauf zielt das System ja ab. Aber selbst wenn das nicht reicht, wissen wir genau, wieviel uns durch die Lappen geht.
Erik Möller(?) hatte vor einigen Wochen auf wiki-tech vorgeschlagen eine checkbox auf jede neue Seite legen, die ein Admin aktivieren kann und damit in der "new articles" Liste signalisiert, dass der betreffende Artikel schon überprüft wurde. Wer so etwas implementieren will, wird damit bestimmt auf wiki-tech auf offene Ohren treffen.
Das finde ich nicht ausreichend. Ich prüfe wie oben schon erläutert häufiger mal die kurzen neuen Artikel. Ich ändere sie aber in der Regel nicht, auch wenn sie Halbsätze enthalten, nicht wikif. sind usw. Es sollte mehere Checkboxen geben, in denen man ankreuzen kann, was an dem Artikel noch zu erledigen ist.
Ein solcher Mechanismus wäre auch nicht schlecht, sollte aber nicht an den Adminstatus gebunden sein. Andererseits macht es auch wenig Sinn, jedem eine solche Bewertung zu ermöglichen. Man bräuchte einen neuen Status wie "erfahrener Benutzer" o.ä., was alles wieder ziemlich kompliziert machen würde.
Im Grunde läuft deine Idee auf dem von mir schon vor langer Zeit vorgeschlagenen Reviewers-Mode hinaus. Man klickt auf einen Button "Review" und bekommt einen ungeprüfen Artikel vorgesetzt, den man prüfen, bewerten, verbessern kann. Das System entscheidet dann, welchen Artikel es aufgrund der Bewertung nochmal jemand anderem Vorsetzen muss, am besten nach dessen vorlieben...
Vollständig geprüfte Artikel werden niemandem mehr vorgesetzt...
--Ivo Köthnig
Hallo Ivo, vielen Dank für die Überprüfung meiner Rechnung. Nicht nur Artikel müssen geprüft werden. :-)
Was passiert, wenn sich die Prüfungen nicht (wie oben angenommen) gleichmäßig auf die Prüfenden verteilen? Dass Ergebniss sollte dann doch besser ausfallen, da die Annahme "jeder prüft einen Artikel nur einmal" wohl richtig ist.
Das ist der einzige Teil deiner E-Mail, den ich leider nicht verstehe. Mag sein, dass das Ergebnis besser wird, wenn ein Benutzer z.B. 300 statt 100 Artikel am Tag prüft. Aber wenn man dabei immer noch sehr weit von der Gesamtzahl der Artikel (1000 pro Tag) entfernt bleibt, bringt das sehr wahrscheinlich auch nicht viel.
Problematischer ist die Annahme, dass ein Benutzer den zu prüfenden Artikel völlig zufällig wählt. In der Regel arbeitet er in einem gewissen Zeitfenster. und prüft dann alle Artikel, die gewisse Kriterien besitzen. Das Zeitfenster ist kein Problem. Man kann hier wieder eine Worst-Case-Betrachtung machen. Statt einem Tag, wählt man 10min und betrachet dann die 10min des Tages (der Woche), mit den ungünstigsten Paramtern.
Wenn sich die Benutzer mit ihren Zeitfenstern nicht absprechen, dürfte sich an der Kontroll-Wahrscheinlichkeit nichts ändern. Das bringt mich aber auf die simple Idee, dass sich die Benutzer absprechen könnten. Statt den Benutzern ein zufälliges (aber abgesprochenes) Kontingent von neuen Artikeln zuzuteilen, könnte man sich auch so absprechen, dass einige Benutzer die neuen Artikel prüfen, die von 9-10 Uhr geschrieben werden, andere die, die von 10-11 Uhr geschrieben wurden etc. Es wäre dabei nicht einmal nötig, zu dieser Zeit anwesend zu sein. Man könnte auch nachträglich auf der Seite der neuen Artikel etwas zurückblättern und dann diese Artikel überprüfen. Um nicht missverstanden zu werden: Man geht damit keine Verpflichtung ein, sondern sagt damit nur, dass man, *wenn* man prüft, bevorzugt die Artikel aus einem bestimmten Zeitraum prüft, um Überschneidungen mit anderen Benutzern gering zu halten.
Schwierig sind nur die Kriterien. Ich geh in der Liste der neuen Artikel alle besonder kurzen Artikel durch, wenn ich mal Bock drauf hab. Dann fliegen vor allem Artikel raus, die zu wenig Inhalt besitzen. URVs finde ich damit aber keine.
Ja, die kurzen Artikel sehe ich mir auch meistens an. Gerade bei denen gibt es vermutlich die meisten Überschneidungen, und umso weniger werden die anderen Artikel geprüft.
Wir sollten die Parameter mittels Umfragen mal von Zeit zu Zeit überprüfen und ausrechnen wie schlecht oder gut wir in welchem Bereich (im schlimmsten Fall) sind.
Mir ist nicht ganz klar, was du hier mit "Umfrage" meinst. Was man einfach machen könnte, sind Stichproben: Man wählt zufällig z.B. 100 Artikel aus und bewertet sie nach Kriterien wie: vandalisiert, wikifiziert etc. Falls die Aufgabenverteilung nach der Uhrzeit der Artikelerstellung realisiert werden sollte, könnte man auch später prüfen, welche Qualität die zu den unterschiedlichen Uhrzeiten angelegten Artikel haben und dann entsprechend die Verteilung der Prüfer auf die Zeiträume neu gewichten.
[andere Möglichkeit: Artikel bewerten]
Im Grunde läuft deine Idee auf dem von mir schon vor langer Zeit vorgeschlagenen Reviewers-Mode hinaus. Man klickt auf einen Button "Review" und bekommt einen ungeprüfen Artikel vorgesetzt, den man prüfen, bewerten, verbessern kann. Das System entscheidet dann, welchen Artikel es aufgrund der Bewertung nochmal jemand anderem Vorsetzen muss, am besten nach dessen vorlieben...
Ich hätte nichts dagegen, ein solches System einzuführen. Aber dafür müsste man vermutlich eine ganze Menge programmieren, und das dauert bekanntlich, falls überhaupt jemand bereit ist, diese Aufgabe zu übernehmen und die Idee nicht wieder zerredet wird ("schon wieder so ein Sifter-artiger Vorschlag").
El
Am Donnerstag, 11. März 2004 17:15 schrieb elwp@gmx.de:
Hallo Ivo, vielen Dank für die Überprüfung meiner Rechnung. Nicht nur Artikel müssen geprüft werden. :-)
Ja, besonders wenn sie komplizierte Beweise enthalten. Nun der war noch recht einfach... :-)
Was passiert, wenn sich die Prüfungen nicht (wie oben angenommen) gleichmäßig auf die Prüfenden verteilen? Dass Ergebniss sollte dann doch besser ausfallen, da die Annahme "jeder prüft einen Artikel nur einmal" wohl richtig ist.
Das ist der einzige Teil deiner E-Mail, den ich leider nicht verstehe. Mag sein, dass das Ergebnis besser wird, wenn ein Benutzer z.B. 300 statt 100 Artikel am Tag prüft. Aber wenn man dabei immer noch sehr weit von der Gesamtzahl der Artikel (1000 pro Tag) entfernt bleibt, bringt das sehr wahrscheinlich auch nicht viel.
Die Annahme war, dass jeder Prüfer P Artikel pro Tag prüft! Kann ja sein, dass ein Prüfer nur 5 und einer 15 prüft. Im Schnitt prüfen sie 10. Und bei Gleichverteilung (wie du angenommen hat) wird das Ergebnis für uns am schlechtesten (wäre also der Worst-Case). Wir brauchen uns also nur um die Zahl der Prüfer und die Gesamtzahl der Prüfungen zu kümmern, um eine Abschätzung zu bekommen.
Problematischer ist die Annahme, dass ein Benutzer den zu prüfenden Artikel völlig zufällig wählt. In der Regel arbeitet er in einem gewissen Zeitfenster. und prüft dann alle Artikel, die gewisse Kriterien besitzen. Das Zeitfenster ist kein Problem. Man kann hier wieder eine Worst-Case-Betrachtung machen. Statt einem Tag, wählt man 10min und betrachet dann die 10min des Tages (der Woche), mit den ungünstigsten Paramtern.
Wenn sich die Benutzer mit ihren Zeitfenstern nicht absprechen, dürfte sich an der Kontroll-Wahrscheinlichkeit nichts ändern. Das bringt mich aber auf die simple
Nein, es kann sein, dass zu einem bestimmtn Zeitfenster viele Nutzer prüfen (immer 12.00 Uhr) zu einem anderen (Nachts um 1.00 Uhr) gar keiner, aber das Verhalten der Schreiber anders ist. Dann wirds problematisch...
Schwierig sind nur die Kriterien. Ich geh in der Liste der neuen Artikel alle besonder kurzen Artikel durch, wenn ich mal Bock drauf hab. Dann fliegen vor allem Artikel raus, die zu wenig Inhalt besitzen. URVs finde ich damit aber keine.
Ja, die kurzen Artikel sehe ich mir auch meistens an. Gerade bei denen gibt es vermutlich die meisten Überschneidungen, und umso weniger werden die anderen Artikel geprüft.
Wir sollten die Parameter mittels Umfragen mal von Zeit zu Zeit überprüfen und ausrechnen wie schlecht oder gut wir in welchem Bereich (im schlimmsten Fall) sind.
Mir ist nicht ganz klar, was du hier mit "Umfrage" meinst.
Man wähle 200 aktive Nutzer zufällig aus und frage sie nach gewissen Verhaltensmustern aus. Danach lassen sich die nötigen Parameter (A, B, P) extrahieren...
Was man einfach machen könnte, sind Stichproben: Man wählt zufällig z.B. 100 Artikel aus und bewertet sie nach Kriterien wie: vandalisiert, wikifiziert etc. Falls die
Nee, so meinte ich dass nicht...
Aufgabenverteilung nach der Uhrzeit der Artikelerstellung realisiert werden sollte, könnte man auch später prüfen, welche Qualität die zu den unterschiedlichen Uhrzeiten angelegten Artikel haben und dann entsprechend die Verteilung der Prüfer auf die Zeiträume neu gewichten.
Im Grunde läuft deine Idee auf dem von mir schon vor langer Zeit vorgeschlagenen Reviewers-Mode hinaus. Man klickt auf einen Button "Review" und bekommt einen ungeprüfen Artikel vorgesetzt, den man prüfen, bewerten, verbessern kann. Das System entscheidet dann, welchen Artikel es aufgrund der Bewertung nochmal jemand anderem Vorsetzen muss, am besten nach dessen vorlieben...
Ich hätte nichts dagegen, ein solches System einzuführen. Aber dafür müsste man vermutlich eine ganze Menge programmieren, und das dauert bekanntlich, falls überhaupt jemand bereit ist, diese Aufgabe zu übernehmen und die Idee nicht wieder zerredet wird ("schon wieder so ein Sifter-artiger Vorschlag").
Man muss aber am vorhandenen Code nicht viel ändern. Die Änderungen werden sowieso mitgelogged und zusätzlich merken müssten man sich nur die Berwertungen der Prüfer...
Aus einem Pool von Artikeln zufällig was auswählen, ist ja nicht schwer...
--Ivo Köthnig
Hallo!
Erstmal, das finde ich als (bisher) eher Gelegenheits-Wikipedianer ein ziemlich wichtiges Thema; ich habe festgesteller, daß es nicht sehr ermutigend ist, irgendwie, wenn man sich schlicht Artikel von "Letzte Änderungen" schnappt, weil man eben nicht weiß, ist da jetzt schon jemand drüber oder nicht. Zumal ich genau weiß, daß ich bei vielen Artikeln höchstens Rechtschreibfehler u.ä. korrigieren könnte, bei manchen vielleicht nicht mal das (weil ich Fachausdrücke einfach nicht kenne). Und der Hang eher nicht computer-gewohnter Menschen, nix anzufassen, was man ihnen nicht mindestens x-Mal erklärt hat, der dürfte noch anderen außer mit bekannt sein. Da könnte das auch Hindernisse abbauen, weil beispielsweise Rechtschreibfehler korrigieren trauen sich die meisten davon immerhin doch.
On Thu, 11 Mar 2004 14:09:05 +0100, you wrote:
Es sollte mehere Checkboxen geben, in denen man ankreuzen kann, was an dem Artikel noch zu erledigen ist.
Das halte ich wegen oben gesagtem für eine sehr gute Idee. Erstens wüßte man, was noch gar nicht bearbeitet wurde, und zweitens würde man auch schnell wissen, wo man noch etwas Inhaltliches zutun sollte. Bei letzteres wäre natürlich auch eine Sortierung nach Fachgebieten sinnvoll. Bei Mathe und Naturwissenschaften müßte ich da nämlich gleich passen ;-)
Mein Vorschlag für Checkboxen wäre: 1. Rechtschreibung, Sätze, Wiki-Format 2. Inhalt überprüfen 3. Inhalt ergänzen
Schöne Grüße Alex
Am Freitag, 12. März 2004 13:23 schrieb Alex Regh:
Hallo!
Erstmal, das finde ich als (bisher) eher Gelegenheits-Wikipedianer ein ziemlich wichtiges Thema; ich habe festgesteller, daß es nicht sehr ermutigend ist, irgendwie, wenn man sich schlicht Artikel von "Letzte Änderungen" schnappt, weil man eben nicht weiß, ist da jetzt schon jemand drüber oder nicht. Zumal ich genau weiß, daß ich bei vielen Artikeln höchstens Rechtschreibfehler u.ä. korrigieren könnte, bei manchen vielleicht nicht mal das (weil ich Fachausdrücke einfach nicht kenne). Und der Hang eher nicht computer-gewohnter Menschen, nix anzufassen, was man ihnen nicht mindestens x-Mal erklärt hat, der dürfte noch anderen außer mit bekannt sein. Da könnte das auch Hindernisse abbauen, weil beispielsweise Rechtschreibfehler korrigieren trauen sich die meisten davon immerhin doch.
On Thu, 11 Mar 2004 14:09:05 +0100, you wrote:
Es sollte mehere Checkboxen geben, in denen man ankreuzen kann, was an dem Artikel noch zu erledigen ist.
Das halte ich wegen oben gesagtem für eine sehr gute Idee. Erstens wüßte man, was noch gar nicht bearbeitet wurde, und zweitens würde man auch schnell wissen, wo man noch etwas Inhaltliches zutun sollte. Bei letzteres wäre natürlich auch eine Sortierung nach Fachgebieten sinnvoll. Bei Mathe und Naturwissenschaften müßte ich da nämlich gleich passen ;-)
Mein Vorschlag für Checkboxen wäre:
- Rechtschreibung, Sätze, Wiki-Format
- Inhalt überprüfen
- Inhalt ergänzen
Naja, bevor wir nicht einen Developer finden, der dass implementiert, brauchen wir soweit gar nicht ins Detail gehen... :-(
--Ivo Köthnig
Hi!
On Fri, 12 Mar 2004 13:57:27 +0100, you wrote:
Naja, bevor wir nicht einen Developer finden, der dass implementiert, brauchen wir soweit gar nicht ins Detail gehen... :-(
Wohl richtig, aber ein Developer wird wohl eher was machen, wenn er eine schwache Ahnung hat, was es denn werden soll. Ich glaube, alle, die das öfters machen, sind immer so schwerst begeistert, wenn sich mittendrin die Planung ändert ;-)
Schöne Grüße Alex
Salve!
Am Freitag, 12. März 2004 14:31 schrieb Alex Regh:
On Fri, 12 Mar 2004 13:57:27 +0100, you wrote:
Naja, bevor wir nicht einen Developer finden, der dass implementiert, brauchen wir soweit gar nicht ins Detail gehen... :-(
Wohl richtig, aber ein Developer wird wohl eher was machen, wenn er eine schwache Ahnung hat, was es denn werden soll. Ich glaube, alle, die das öfters machen, sind immer so schwerst begeistert, wenn sich mittendrin die Planung ändert ;-)
Genau meine Meinung, ein klares Konzept ist doch schon die halbe Entwicklung. Also was spricht dagegen ein möglichst gutes System jetzt zu entwerfen?
BTW, es wäre auch eine Lösung möglich, bei dem auf dem Server nicht geändert werden muß:
- Admins tragen auf einer Seite "Vertrauenswürdiger Wikipedianer" ein und sprerren diese nach der Änderung. - Ein Bot überwacht diese Seite, das kein normaler Wikipedianer sich oder andere Wikipedianer auf diese Seite einträgt. Eventuell wird die Pflege der Liste von "Vertraueswrdiger WIkipedianer" einpaar Bürokraten übertragen.
-Ein Skript verteilt zu überprüfende Seiten auf mehrere Seiten a 25 Artikel. -Jede dieser 25 Artikelliste existiert dreimal. -"Vertrauenswürdige Wikipedianer" die Artikel checken wollen tragen sich auf einer Übersichtsseite (hinter einem der drei links zu der Übersichtsseite mit 25 Artikeln) ein, das sie die 25 Artikel überprüfen wollen. -sie arbeiten die 25 Artikel ab und vermerken ihr Urteil + vier Tilden auf der Seite. -Das Skript erkennt, wenn diese Übersichtsseite von einem Vertrauenswürdigen Wikipedianer abgearbeitet ist und vermerkt auf der Gesamtübersichtsseite, das der "Vertrauswürdige Wikipedianer" mit den 25 Artikeln fertig ist. - Wenn alle 25-Artikle von drei "VW" geprüft sind, erstellt das Skript ein Zusammenfassung der Urteile.
Weil mir die Bearbeitungskonflikte bei Löschkandidaten "etwas" auf den Wecker gehen, könnte das Skript auch ständig zwei links zu je 25 Artikel für die VWs anbieten: [[Benutzer:RobertMichel/Prüfen]] o.ä. Auf dieser Seite stände dann soetwas wie
Hallo, diese Seite ist nur für den Benutzer RobertMichel, der gebeten wird als [[Vertraueswürdiger Wikipedianer]] neue Artikel und Änderungen zu Beurteilen und besonders auf [[URV]] und Qualität acht zu geben.
Wenn Du Verantwortung zum Prüfen von eine Liste von 25 Artikel übernimmst, so kenzeichne diese mit vier Tilden hinter der Liste. Du hast dann maximal zwei Stunde Zeit, diese Liste abzuarbeiten. Es ist wichtig, das Du die Liste innerhalb dieser Zeit komplett gewissenhaft abarbeitest, weil sie sonst vom System ebenfalls an einem anderen "Vertrauenswürdigen Wikipedianer" anvertraut wird.
Bitte übernehme nur die Verantwortung für eine Liste und arbeite diese komplett ab.
* [[Wikipedia:Prüfen/25 Artikel hereingestellt 12.03.2004 16:05 - RobertMichel]] * [[Wikipedia:Prüfen/25 Artikel hereingestellt 12.03.2004 16:07 - RobertMichel]] --snapp--
O.ä.
Dies soll kurz anreisen, das ohne eine Installation auf dem Server, ohne Aufnahme des Status "Vertrauenswürdiger Wikipedianer" in der Software ein Kontrollsystem mit VWs möglich ist. *g*
Also kann man sich sehrwohl Gedanken um Details machen.
Mein Vorschlag mag einwenig gebastelt und drangestrickt sein, einige Bots zeigen aber, das nicht alles in der Serversoftware integriert sein muß. Außerdem könnte man für die Arbeitsabläufe mit einem Skript ersteinmal flexibel Erfahrung sammeln und dann ein erprobtes System vielleicht doch irgendwann einmal in die Wikipediasoftware integrieren.
Gruss rob
Hallo!
Ergeben sich bei dem System nicht ein paar Probleme?
On Fri, 12 Mar 2004 16:43:05 +0100, you wrote:
- Admins tragen auf einer Seite "Vertrauenswürdiger Wikipedianer" ein und
sprerren diese nach der Änderung.
Da geht der Krach nämlich schon los -- wer ist denn vertrauenswürdig. Außerdem sind wohl die meisten Leute vertrauenswürdig; jedenfalls würde ich ihnen dahingehend vertrauen, daß sie wenigstens Rechtschreib- und Grammatikfehler korrigieren könnten. Und auch zum Inhalt *einiger* Artikel kann wohl jede/r was beitragen, bzw. den überprüfen. Eine Beschränkung eines Korrektur-Systems auf Angemeldete wäre allerdings höchst sinnvoll; auch wenn es angemeldete Pappnasen gibt, habe ich doch den subjektiven Eindruck gewonnen, daß unter den IPlern der Pappnasenanteil irgendwie höher ist.
[...]
-Ein Skript verteilt zu überprüfende Seiten auf mehrere Seiten a 25 Artikel. -Jede dieser 25 Artikelliste existiert dreimal.
Problem: Was ist, wenn z.B. ich dann 25 Artikel über Mathe und Physik bekomme? Aus den letzten Änderungen suche ich mir die erst gar nicht raus; und solange eine Kategorisierung nicht existiert, müßte man wohl da anfangen.
-"Vertrauenswürdige Wikipedianer" die Artikel checken wollen tragen sich auf einer Übersichtsseite (hinter einem der drei links zu der Übersichtsseite mit 25 Artikeln) ein, das sie die 25 Artikel überprüfen wollen.
Im Prinzip sinnvoll, damit sich nicht 2 gleichzeitig dransetzen, sollte aber möglichst einfach sein. Würde sich vielleicht über eine Seite "Letzte Änderungen, nicht überarbeitet", "Letzte Änderung, Inhalt überprüfen" und "Letzte Änderungen, Inhalt unvollständig" oder so machen lassen, die jeder (angemeldet) aufrufen kann. Ruft man von da einen Artikel auf, verschwindet der entweder von der Liste, oder wird entsprechend markiert. Schätze, für letzteres bräuchte man JavaScript oder so.
-sie arbeiten die 25 Artikel ab und vermerken ihr Urteil + vier Tilden auf der Seite.
Auch nicht ermutigend; hat nicht jede/r Zeit, mal eben über 25 Artikel zu gehen, daher schreckt das ab. Und 100 Leute, die vielleicht 10 Artikel überarbeiten, bringen mehr, als 10, die je 25 überarbeiten.
-Das Skript erkennt, wenn diese Übersichtsseite von einem Vertrauenswürdigen Wikipedianer abgearbeitet ist und vermerkt auf der Gesamtübersichtsseite, das der "Vertrauswürdige Wikipedianer" mit den 25 Artikeln fertig ist.
Das würde mich schonmal abschrecken, da ich weiß, daß meine Leistung sehr tagesformabhängig ist. Von anderen Gelegenheiten kenne ich das ebenfalls, daß Leute z.B. mal eine Runde nicht können, weil es auf der Arbeit hakt, sie krank sind etc. Wenn dann so etwas da ist, was doch stark nach Leistungskontrolle aussieht (auch wenn's nicht so gemeint ist) dürfte das die Leistungswilligkeit nicht eben steigern.
- Wenn alle 25-Artikle von drei "VW" geprüft sind, erstellt das Skript ein
Zusammenfassung der Urteile.
Wozu? Das müßte erstmal einen Sinn haben, und der könnte nur in einer weiteren Markierung liegen "Inhalt überprüfen" oder sonstwas.
[...]
Wenn Du Verantwortung zum Prüfen von eine Liste von 25 Artikel übernimmst, so kenzeichne diese mit vier Tilden hinter der Liste. Du hast dann maximal zwei Stunde Zeit, diese Liste abzuarbeiten. Es ist wichtig, das Du die Liste innerhalb dieser Zeit komplett gewissenhaft abarbeitest, weil sie sonst vom System ebenfalls an einem anderen "Vertrauenswürdigen Wikipedianer" anvertraut wird.
1. wäre sowas nur dann sinnvoll, wie ich bereits sagte, wenn die nicht mit einem Namen verbunden wäre. Könnte sich jeder so eine Liste schnappen, wäre das ein wesentlich brauchbarerer Konzept.
2. ist die Zeitbeschränkung auf 2 Stunden etwas knapp. Ich recherchiere auch schonmal kurz nach, ob eine Aussage, die mir seltsam vorkommt, auch stimmt. Da könnten 2 Stunden äußerst knapp werden. Außerdem bin ich mir ziemlich sicher, daß die Anzahl 25 für viele bis dahin nicht so sonderlich aktive Wikipediander ein bisschen hoch ist.
[...]
Fazit meinerseits: Ein Listen-Konzept könnte u.U. brauchbar sein, wenn auch IMO nicht in der vorliegenden Form, aber eine Markierung betreffs der notwendigen Überarbeitungen ist IMO zwingend, insbesondere wenn eine Kategorisierung noch nicht da ist. Denn Rechtschreibung checken und Inhalt überprüfen sind zwei Paar Schuhe. Und eine Trennung wäre da IMO sehr sinnvoll, grade damit sich die Leute, die von einem weniger gut vertretenen Thema Ahnung haben, sich auf die inhaltliche Kontrolle der entsprechenden Beiträge konzentrieren können.
Und, wie der Einwand betreffs der Developer zeigt, wäre es wohl sehr sinnvoll, auch relativ früh zu klären, was denn mir wieviel Aufwand machbar wäre. Ein komplett neues, komplexes System würde es wohl schwieriger haben, jemanden zu finden, der es implementiert.
Schöne Grüße Alex
Salve Alex,
es freut mich, das Du meine Mail beantwortet und um Ideen, Kritikpunkte ergänzt hast. Es tut mir sehr leid, das ich einpaar journalistische Handwerkskniffe wie z.B. [[Trichteraufbau]] nicht berücksichtigt habe.
Ja, ich habe eine Draft-Softwarelösung zur Diskussion gestellt. Es ging mir aber dabei nicht um die Lösung im Detail, sonder ich wollte aufzeigen, das eine externe Lösung ohne Modifikation der Wikikpediasoftware bereits heute mögich ist. D.h. es keine Notwenigkeit besteht auf auf einen Möglichen Status "Vertrauenswürdiger Wikipedianer" zu warten.
Am Freitag, 12. März 2004 19:53 schrieb Alex Regh:
Da geht der Krach nämlich schon los
Bitte verwende einen sachlicheren Diskussionstiel, ich werden nicht ausfallend werden, also wenn Du Krach erwartest muß dies an Deiner Einstellung liegen.
Deine Detailantworten sind, genauso wie die Details meiner Draft-Lösung erst in der Zukunft vielleicht relevant.
Fazit meinerseits: Ein Listen-Konzept könnte u.U. brauchbar sein,
Fokus bitte auf exteren oder integrierte Lösung.
wenn auch IMO nicht in der vorliegenden Form,
Das ist ein ganz anderes Thema.
Und, wie der Einwand betreffs der Developer zeigt, wäre es wohl sehr sinnvoll, auch relativ früh zu klären, was denn mir wieviel Aufwand machbar wäre. Ein komplett neues, komplexes System würde es wohl schwieriger haben, jemanden zu finden, der es implementiert.
Neben dem System/GUI aus Anwendersicht, gibt es verschiedene Strategiemöglichkeiten ein System zu entwerfen.
Ich wollte NUR aufzeigen, es geht auch als externes System.
Schön das man mißverstanden wird, wenn man nur schreibt "das geht auch extern" - dann kommt die Frage wie? Nein!.... Gibt man eine Draftlösung zum Besten um direkt zu zeigen das es auch extern geht heist es: -Falsch -Da geht der Krach nämlich schon los -Nein, so nicht -....
Jetzt weiß ich, warum Developer am liebsten das Entwickeln, was ihnen am Herzen liegt und lange Diskssionen scheuen.
Moral von dieser Mail: Es geht nicht um Diskussion der Diskussions wegen, auch nicht um kaninchenzüchtervereitsparagraphenreiterer, sonder um Motivation und der Suche nach einer möglichst smarten Lösung. ;)
Bitte bleibt sachlich, optimistisch das man gemeinsame Lösungen, gemeinsame Nenner findet und sowie ganz wichtig tollerant. Ansonsten hat eine Diskussion wenig Zukunft.
[[Trichteraufbau]] ist wohl auch für Emails Nutzbar ;)
Gruss rob
Hallo!
On Fri, 12 Mar 2004 22:14:54 +0100, you wrote:
Da geht der Krach nämlich schon los
Bitte verwende einen sachlicheren Diskussionstiel, ich werden nicht ausfallend werden, also wenn Du Krach erwartest muß dies an Deiner Einstellung liegen.
Da hast du was mißverstanden -- ich meinte selbstverständlich nicht, daß da ein Krach zwischen uns beiden losgehen würde; sondern was ich meinte ist daß mit Sicherheit Krach darum ausbrechen würde, wer denn nun ein "Vertrauenswürdiger Wikipedianer" ist. Das wird dann nicht anders ausschauen als heute die Beschimpfungen gegen die Admins, siehe Herbeye.
Alex (der sich schon wundert über dieses Mißverständnis)
Salve Alex,
Am Samstag, 13. März 2004 03:22 schrieb Alex Regh:
Da hast du was mißverstanden -- ich meinte selbstverständlich nicht, daß da ein Krach zwischen uns beiden losgehen würde; sondern was ich meinte ist daß mit Sicherheit Krach darum ausbrechen würde, wer denn nun ein "Vertrauenswürdiger Wikipedianer" ist.
Mag sein, das ich mit meiner Antwort etwas überreagiert habe, mir ging es aber darum aufzuzeigen das eine externe Softwarelösung möglich ist. Desweitern ging ich davon aus, das der "Trusted Wikipedianer" der "Vertrauenswürdige Wikipedianer" sowohl aus Admin als auch Sicht der aktiven Wikipedianer eine sehr sinvolle Lösung ist.
Statt darauf zuwarten, das dieser Ansatzt "Vertraueswürdiger Wikipedia" in der Software integriert wird, wollte ich aufzeigen, das dieser Ansatz auch durch eine Skripte und Listen extern möglich ist.
Damit wollte ich nicht eine Diskussion starten für und gegen "Vertrauenswürdige Wikipedianer".
Das wird dann nicht anders ausschauen als heute die Beschimpfungen gegen die Admins, siehe Herbeye (der sich schon wundert über dieses Mißverständnis)
Du siehst es ja immer noch negativ.
Meine externe Lösung ließe sich auch auf Portale anwenden, das registrierte Wikipedianer, die zu einem Thema etwas beitragenmöchten und bei einem Projekt/Portal registiert sind nur diese fachspezifischen Artikel begutachten würden.
Ich möchte aber jetzt nicht erklären wie dies möglich wäre, um die Diskussion nicht zuweit von meiner Vorherigen Mail abzulenken:
Eine Externe Listen/Skript Lösung würde eine effizieteres Kontrollsystem ohne Eingriff in die Standard Wikipediasoftware ermöglichen. ----
In meinen Augen entsteht Krach nur bei Leuten die nicht kompromissbereit sind, wie laut er wird, hängt stark von seinen eigenen Eigenschaften ab zuzuhören, einzugehen, Argumente aufzunehmen, zu erklären und für mehrheites Entscheidungen oder für bessere Lösungen unprovokativ zu werben ;)
Also wenn Du so Sorge vor Krach hast, hast Du sicherlich auch eine hohe Motivation diesen zu Vermeiden. Statt den Teufel an die Wand zu malen und den Krach schon kommen sehen - Warum siehst Du ihn kommen? - Hast Du eine bessere Idee? - bzw was meinst Du ist nötig bei einem Kontrollsystem wichtig zu implementieren - und bei der Einführung zu erklären um Krach zu vermeiden?
Gruss rob
Naja, bevor wir nicht einen Developer finden, der dass implementiert, brauchen wir soweit gar nicht ins Detail gehen... :-(
Wo wir mal wieder bei Wünschen sind: Ich bräuchte eine Funktion zum "Überwachen" von Benutzern, die ganz analog zur Beobachtungsliste für Artikel funktioniert (Benutzer bzw. IP-Adresse markieren, anschliessend werden Aktivitäten der jeweiligen Benutzer automatisch auf einer speziellen Seite aggregiert und "gemeldet".
Mir ist schon klar, dass ich mir jeweils *einen* Benutzer *manuell* raussuchen und anklicken kann, um ein Aktivitätsprotokoll zu bekommen ("Benutzerbeiträge"), ich hätte aber gerne einen Automatismus, der einspringt, sobald die auserwählten Benutzer/IPs aktiv wrden, und das übersichtlich und zeitnah darstellt. Zumindest mir würde das helfen, mir bei Konflikten wie Nephelin/Elian ein Bild zu machen.
Dabei geht es mit nicht nur um die Überwachtung (z.B. der Machenschaften von Figuren wie "Wikipedia Cop"), sondern auch um das rein positive Beobachten, was beispielsweise ein Benutzer mit verwandten Interessen so be-/erarbeitet.
Vielleicht gibt es eine solche Funktion ja schon, und ich habe sie übersehen; falls nicht: wäre das ein sinnvoller RFE, oder gibt es dabei Bendenken (Privacy...)?
MfG -asb
Wo wir mal wieder bei Wünschen sind: Ich bräuchte eine Funktion zum "Überwachen" von Benutzern, die ganz analog zur Beobachtungsliste für Artikel funktioniert (Benutzer bzw. IP-Adresse markieren, anschliessend werden Aktivitäten der jeweiligen Benutzer automatisch auf einer speziellen Seite aggregiert und "gemeldet".
Mir ist schon klar, dass ich mir jeweils *einen* Benutzer *manuell* raussuchen und anklicken kann, um ein Aktivitätsprotokoll zu bekommen ("Benutzerbeiträge"), ich hätte aber gerne einen Automatismus, der einspringt, sobald die auserwählten Benutzer/IPs aktiv wrden, und das übersichtlich und zeitnah darstellt. Zumindest mir würde das helfen, mir bei Konflikten wie Nephelin/Elian ein Bild zu machen.
Dabei geht es mit nicht nur um die Überwachtung (z.B. der Machenschaften von Figuren wie "Wikipedia Cop"), sondern auch um das rein positive Beobachten, was beispielsweise ein Benutzer mit verwandten Interessen so be-/erarbeitet.
Vielleicht gibt es eine solche Funktion ja schon, und ich habe sie übersehen; falls nicht: wäre das ein sinnvoller RFE, oder gibt es dabei Bendenken (Privacy...)?
Hmmm, wenn man einzelne Benutzer beobachten kann, dann sollte es kein besonders großes Problem sein auch Benutzergruppen zusammen beobachten zu dürfen. Fände das Feature an sich schon recht vernünftig...
Die Überwachung bereitet mir zwar Bauchschmerzen, aber es ist ja nun mal das Konzept des Wikis, dass jeder jeden überwacht und damit passt dass schon...
--Ivo Köthnig
Ivo Köthnig koethnig@web.de writes:
Vielleicht gibt es eine solche Funktion ja schon, und ich habe sie übersehen; falls nicht: wäre das ein sinnvoller RFE, oder gibt es dabei Bendenken (Privacy...)?
wget http://de.wikipedia.org/w/wiki.phtml?title=Spezial:Contributions&target=...
ist vielleicht schon ausreichend.
Hmmm, wenn man einzelne Benutzer beobachten kann, dann sollte es kein besonders großes Problem sein auch Benutzergruppen zusammen beobachten zu dürfen. Fände das Feature an sich schon recht vernünftig...
Mit wget die Listen holen und mit einem bißchen 'sort' in eine Liste packen - das sollte nicht schwer sein.
Am Freitag, 12. März 2004 20:01 schrieb Karl Eichwalder:
Ivo Köthnig koethnig@web.de writes:
Vielleicht gibt es eine solche Funktion ja schon, und ich habe sie übersehen; falls nicht: wäre das ein sinnvoller RFE, oder gibt es dabei Bendenken (Privacy...)?
wget http://de.wikipedia.org/w/wiki.phtml?title=Spezial:Contributions&target=...
Ich bin mir nicht sicher, aber ich glaube wget ist gesperrt und funktioniert nicht...
--Ivo Köthnig
Ivo Köthnig koethnig@web.de writes:
wget http://de.wikipedia.org/w/wiki.phtml?title=Spezial:Contributions&target=...
Ich bin mir nicht sicher, aber ich glaube wget ist gesperrt und funktioniert nicht...
Es geht zumindest, wenn ich durch meinen lokalen Proxy gehe. Notfalls:
wget --user-agent='Mozilla 1.4' \ http://de.wikipedia.org/w/wiki.phtml?title=Spezial:Contributions&target=...
'wget --proxy=off' tut aber auch.
Ivo Köthnig schrieb:
Ich bin mir nicht sicher, aber ich glaube wget ist gesperrt und funktioniert nicht...
Aber nur, damit nicht jeder ahnungslose Depp uns durch zu schnelles Spidern die Server in die Knie zwingt. Man kann wget durchaus so konfigurieren, dass es einen anderen Useragent-String schickt, außerdem kann man dem Programm auch sagen, dass es die Robots.txt, in der auf freiwilliger Basis die Programme vermerkt sind, die nicht spidern sollen dürfen, einfach ignoriert. Wir gehen einfach davon aus, dass diejenigen Leute, die so intime Kenntnis von wget haben, dass sie obige Punkte umsetzen können, auch so verantwortungsbewusst sind, langsam zu spidern.
Alwin Meschede
Am Sonntag, 14. März 2004 10:43 schrieb Alwin Meschede:
Ivo Köthnig schrieb:
Ich bin mir nicht sicher, aber ich glaube wget ist gesperrt und funktioniert nicht...
Aber nur, damit nicht jeder ahnungslose Depp uns durch zu schnelles Spidern die Server in die Knie zwingt. Man kann wget durchaus so konfigurieren, dass es einen anderen Useragent-String schickt, außerdem kann man dem Programm auch sagen, dass es die Robots.txt, in der auf freiwilliger Basis die Programme vermerkt sind, die nicht spidern sollen dürfen, einfach ignoriert. Wir gehen einfach davon aus, dass diejenigen Leute, die so intime Kenntnis von wget haben, dass sie obige Punkte umsetzen können, auch so verantwortungsbewusst sind, langsam zu spidern.
Und wie spidert man langsam? kann man das wget auch sagen? Was bedeutet langsam? Nach jedem File 3 Sek. warten. oder deutlich länger?
--Ivo Köthnig
Ivo Köthnig schrieb:
Und wie spidert man langsam? kann man das wget auch sagen? Was bedeutet langsam? Nach jedem File 3 Sek. warten. oder deutlich länger?
hmmm, ein kurzes wget ergibt eine syntax, die vielleicht so oder so ähnlich aussehen könnte.
wget -w=2 -r -l=0 -L -np --limit-rate=$whatever
Hab es nicht ausprobiert.
Mathias
Am Sonntag, 14. März 2004 11:05 schrieb Mathias Schindler:
Ivo Köthnig schrieb:
Und wie spidert man langsam? kann man das wget auch sagen? Was bedeutet langsam? Nach jedem File 3 Sek. warten. oder deutlich länger?
hmmm, ein kurzes wget ergibt eine syntax, die vielleicht so oder so ähnlich aussehen könnte.
wget -w=2 -r -l=0 -L -np --limit-rate=$whatever
Also wenn wget so eine Option hat, finde ich die schon selber raus, ich wollte nur hören, wieviel zeit man lassen muss/sollte...
--Ivo Köthnig
Am Freitag, 12. März 2004 14:31 schrieb Alex Regh:
Hi!
On Fri, 12 Mar 2004 13:57:27 +0100, you wrote:
Naja, bevor wir nicht einen Developer finden, der dass implementiert, brauchen wir soweit gar nicht ins Detail gehen... :-(
Wohl richtig, aber ein Developer wird wohl eher was machen, wenn er eine schwache Ahnung hat, was es denn werden soll. Ich glaube, alle, die das öfters machen, sind immer so schwerst begeistert, wenn sich mittendrin die Planung ändert ;-)
Wie gesagt, ich hatte schon mal einen detailierten Vorschlag gemacht. Und was man an die Checkboxen ranschreibt ist zwar wichtig, aber dürfte kaum eine vernüftige Planung beeinflussen...
--Ivo Köthnig
On Wednesday 10 March 2004 14:52, elwp@gmx.de wrote:
<snip>
Zuerst ein paar Definitionen: A: Anzahl der pro Tag zu prüfenden Artikel B: Anzahl der Benutzer, die die Artikel prüfen P: Anzahl der Prüfungen pro Benutzer und Tag
Dann gibt N=BP/A an, wie oft ein Artikel im Mittel geprüft wird.
Annahme: Kein Benutzer prüft Artikel mehrfach und wählt unabhängig von den anderen Benutzern die Artikel, die er prüft, zufällig aus.
Die Wahrscheinlichkeit w für einen Artikel, von keinem Benutzer geprüft zu werden ist:
w = X^N mit X=(1-P/A)^(A/P)
w = X^N = (1 - P/A )^B
Für P/A << 1
=> w = 1 - P(B/A) + O((B/A)^2)
P wird i.a. ein Konstante sein, während B und A zeitabhängig sind. Nimmt man an, dass die Anzahl der neuen Artikel A ungefähr proportional zur Anzahl der Benutzer ist, dann ist B/A = const für alle Zeiten t und somit
w = const für alle t
was in etwa dem entspricht, was ich meinte.
Das ganze ist natürlich nur ein Spielzeug-Modell, aber trotzdem sehr schön :-)
Man kann das Modell noch erweitern, indem man nicht nur die Artikel, die gar nicht kontrolliert wurden als Maß benutzt, sondern den Gesamtnutzen der deutschen Wikipedia berechnet. Das könnte in etwas so funktionieren:
Dazu müsste man eine Art Nutzenfunktion einführen, die den "Nutzen" eines Artikels in abh. von der Anzahl der Edits beschreibt. Den Begriff Nutzen verwende ich nur, da das Konzept gewisse Ähnlichkeiten mit dem Nutzen von Güterbündeln in der Mikroökonomie hat. Die Nutzenfkt. wird vermutlich anfangs konkav sein und für sehr große #Edits nahezu konstant bleiben,
z.B. u(e) = log( alpha * e )
wobei u=Nutzenfkt., e=Anz. edits, alpha=const. die experimentell zu bestimmen ist, aber für viele Aussagen auch unerheblich wäre.
Dann wäre noch zu berücksichtigen, dass Artikel eine unterschiedliche Wichtigkeit in der Wahrnehmung nach außen haben: ein Artikel über "Schröder" wird wahrscheinlich mehr Beachtung finden, als einer über "Faulturm". Unterstellt man eine gewisse Korrelation zwischen Wichtigkeit eines Artikels und der Anzahl der Edits und eine log Verteilung der Wichtigkeit an so ließe sich dann der Gesamtnutzen berechnen. FWIW.
Viele Grüße, Marco
Marco:
Zuerst ein paar Definitionen: A: Anzahl der pro Tag zu prüfenden Artikel B: Anzahl der Benutzer, die die Artikel prüfen P: Anzahl der Prüfungen pro Benutzer und Tag
Dann gibt N=BP/A an, wie oft ein Artikel im Mittel geprüft wird.
Annahme: Kein Benutzer prüft Artikel mehrfach und wählt unabhängig von den anderen Benutzern die Artikel, die er prüft, zufällig aus.
Die Wahrscheinlichkeit w für einen Artikel, von keinem Benutzer geprüft zu werden ist:
w = X^N mit X=(1-P/A)^(A/P)
w = X^N = (1 - P/A )^B
Für P/A << 1
=> w = 1 - P(B/A) + O((B/A)^2)
Diese Näherung funktioniert nicht, weil schon der zweite Summand PB/A=N nicht klein ist, sondern sogar über 1 liegen dürfte. In diesem Fall bekommst du, falls du den Rest vernachlässigst, eine Wahrscheinlichkeit, die kleiner als 0 ist.
P wird i.a. ein Konstante sein, während B und A zeitabhängig sind. Nimmt man an, dass die Anzahl der neuen Artikel A ungefähr proportional zur Anzahl der Benutzer ist, dann ist B/A = const für alle Zeiten t und somit
w = const für alle t
Diese Schlussfolgerung ist falsch, weil eben schon die Näherung falsch war.
Man kann das Modell noch erweitern, indem man nicht nur die Artikel, die gar nicht kontrolliert wurden als Maß benutzt, sondern den Gesamtnutzen der deutschen Wikipedia berechnet.
Ich glaube nicht, dass man die Qualität der Artikel irgendwie sinnvoll anhand messbarer Paramter bestimmen können wird. Man könnte aber evtl. untersuchen, ob irgendwelche messbaren Parameter (z.B. Anzahl der Bearbeitungen, Anzahl der Bearbeiter, Bearbeitungszeiträume etc.) sich bei den "exzellenten" Artikeln deutlich von denen der anderen Artikel unterscheiden, aber ich halte es nicht für so aussichtsreich, dass ich mich damit beschäftigen würde.
El
On Saturday 13 March 2004 15:03, elwp@gmx.de wrote:
Marco:
w = X^N mit X=(1-P/A)^(A/P)
w = X^N = (1 - P/A )^B
Für P/A << 1
=> w = 1 - P(B/A) + O((B/A)^2)
Diese Näherung funktioniert nicht, weil schon der zweite Summand PB/A=N nicht klein ist, sondern sogar über 1 liegen dürfte. In diesem Fall bekommst du, falls du den Rest vernachlässigst, eine Wahrscheinlichkeit, die kleiner als 0 ist.
guter Einwand, ich hatte fälschlicherweise P/A << B angenommen ohne auf die Zahlenwerte zu achten. Danke für die Korrektur.
Viele Grüße, Marco
Agon S. Buchholz wrote:
Leider habe ich keine Ahnung, ob und wann wir mit der Einführung von Kategorien rechnen können :-(
Die Kategorie-Funktionen sind bereits in der gegenwärtigen Entwickler-Version der Software enthalten. Beim nächsten (größeren) Update kommt das dann online. Ich schätze mal, jede Sprache kann dann selbst entscheiden, ob sie Kategorien möchte oder nicht.
Magnus
Die Idee ist, dass nicht mehr jeder Benutzer alle neuen Seiten und Seitenbearbeitungen vorgesetzt bekommt, sondern nur noch einen Teil. Welcher Teil das ist, kann er selbst bestimmen (und dabei auch "alles" auswählen, was dem bisherigen Verhalten entspricht).
Die Idee ist diskutierbar. Abgesehen davon möchte ich zur Diskussion stellen, inwieweit man IP-usern das recht nehmen könnte, neue Artikel zu erstellen.
(by the way. Nephelin randaliert derzeit auch auf ar.)
Ich hätte noch einen alternativen Vorschlag, der mir schon seit Tagen durch den Kopf geht:
Wenn sich die aktiveren Benutzer bereit erklären würden pro Woche oder pro Tag 3-4 Artikel zu überprüfen, dann würde das bei genügender Beteiligung ja reichen.
Man müsste sich dann in den Benutzereinstellungen bereit erklären und bekäme dann eben pro Woche/Tag eine Mail mit 3 Links auf die zu überprüfende Seiten. Natürlich wäre es besser, wenn jede Änderung an 2-3 Benutzer geschickt wird, dann erzeugt man eine gewisse Redundanz.
Nur so mal als Idee.
Gruß
Simon.
Hi
Ich weiß nicht warum mein Vorschlag ignoriert wurde. Vielleicht weil mich keiner kennt, oder weil es niemand verstanden hat. Ich jedenfalls finde es den bisher besten Vroschlag zum Thema. ;-) Weil er ohne große Programmieraufwand funktioniert und nur wenig Resourcen verschlingt.
Um die einfachheit darzustellen, mal ein Lösungsvorschlag als so eine Art Perl-Skript:
# zuächst braucht man die Einstellungen der Benutzer # die sich bereit erklärt haben # SQL-Abfrage vermute ich mal %benutzerListe=getBenutzer(); # dann die Liste der neuen Einträge für den aktuellen Tag # auch SQL-Abfrage %neueEintraege=getNeueEintraege();
# jetzt über alle User iterieren while($benutzerListe){ %benutzer=pop(%benutzerListe);
#mail anlegen $mail="Hallo, neue Seiten auf Wikipedia:\n\n\n"; # angegebene Anzahl der vom Benutzer gewünschten # neuen Einträge raussuchen for ($i=0; $i<$benutzer{"Anzahl"};$i++){ %neueSeite=pop(%neueEintraege); # wenn keine neuen Einträge mehr vorhanden: # von vorne anfangen if (!%neueSeite){ %benutzerListe=getBenutzer(); %neueSeite=pop(%neueEintraege); } # URL zur mail hinzufügen $mail.=%neueSeite{"URL"}."\n"; } #gruss .... $mail.="\n\nSei mutig usw...";
# ... und abschicken der mail sendMail($mail,%benutzer{"emailAddress"}); }
##
Das wars - klar im konkreten fall kommen da noch ein paar Sichereheitsabfragen und natürlich die subs dazu. Und natürlich müssen die Benutzereinstellungen dementsprechend angepasst werden.
Die tägliche, oder auch wöchentliche Emails wären zu bester Bot-Zeit ausführbar. Man sollte vielleicht noch mitloggen, welche neuen Seiten, wegen zu wenigen Benutzern unter den Tisch gefallen sind - bzw, wie oft die Liste mit den neuen Einträgen durchgelaufen ist. Der Rechneraufwand beschränkt sich auf die SQL-Abfragen + ein paar Mails, die zu verschicken sind. Bestimmt weniger Aufwand als eine Liste, die ständig aktualisiert werden muss und mehrerer 100 kB Netzlast generiert.
Ok, das war mein Vorschlag. Viel Spass weiterhin, ob mit oder ohne Mails
Simon.
Am Sonntag, 14. März 2004 09:38 schrieb Simon Thiel:
Hi
Ich weiß nicht warum mein Vorschlag ignoriert wurde. Vielleicht weil
Weil sich im Moment glaube ich nicht viele um Meta-Themen kümmern wollen - Zeitmangel. Für mich hört sich der vorschlag gut an. Grundsätzlich würde ich solche technischen Diskussionen (Perl Skript oder PHP, per Seite oder per email auf der Wikitech-Liste bzw. im entsprechenden Chat (da gibt's einen, glaube ich)) führen - da erreichst Du die Programmierer besser. Von der Anwenderseite her denke ich, dass die meisten so eine Art "verbesserte, weil nach gewievtem Alogrithmus nur auszugsweise präsentierte Letzte Änderungen/Neue Artikel" gut finden würden.
Uli
Ich würde evtl. versuchen, etwas in dieser Richtung zu programmieren, falls genug Leute sich vorstellen könnten, dieses System zu nutzen. (Wenn ich der einzige bin, der sich einen Bereich herauspickt, macht das wenig Sinn.)
Guter Vorschlag, aber vielleicht kriegen wirs auch mit weniger Aufwand hin: Was ich bräuchte, wäre ein "recent changes", auf dem nur anonyme Beiträge angezigt werden, und ein "new articles", auf dem nur anonyme Beiträge angezeigt werden. Das sind die kritischen. Leute, die sich anmelden, vandalieren in der Regel nicht. Einen solchen zusätzlichen Filter ("nur anonyme zeigen") in die beiden Seiten einzubauen, sollte relativ einfach machbar sein, oder?
Uli
Ulrich:
Was ich bräuchte, wäre ein "recent changes", auf dem nur anonyme Beiträge angezigt werden, und ein "new articles", auf dem nur anonyme Beiträge angezeigt werden. Das sind die kritischen. Leute, die sich anmelden, vandalieren in der Regel nicht. Einen solchen zusätzlichen Filter ("nur anonyme zeigen") in die beiden Seiten einzubauen, sollte relativ einfach machbar sein, oder?
Ja, in der Tabelle recentchanges ist auch das Feld rc_user, also die User-ID, die bei IP-Nummern-Benutzern =0 ist. Das ist also leicht zu prüfen.
Ich frage mich aber, ob das eine besonders große Verbesserung wäre, denn der Anteil der IP-Nummern-Benutzern ist etwa 1/3. Ich kann weder 14000 noch 5000 Bearbeitungen täglich überprüfen. Und 300 neue Artikel täglich sind mir auch zu viel. Abgesehen davon sind die Beiträge von angemeldeten Benutzern auch nicht immer das Gelbe vom Ei.
El