Stefan Kühn schrieb:
Das wäre auch jetzt schon möglich, da die Bot ja als Benutzer der Wikipedia bekannt sind. Ihre Änderungen werden z.B. deshalb ja nicht mehr in der Liste der letzten Änderungen aufgenommen.
Das war mir nicht bekannt.
Ist das nötig? Nehmen wir mal an 5 Bots arbeiten gleichzeitig an der Wikipedia. Jeder von ihnen arbeitet vielleicht fünfmal so schnell wie ein menschlicher User. Heiß also sie simulieren 25 Nutzer.
Ich habe keinen eigenen Bot am laufen, aber ein Programm sollte doch maximal 200ms für ne Änderung brauchen (+ Wikipedia Wartezeit natürlich) und das ist eher 50 mal schneller als 5 mal schneller.
Meine Frage ist dann: Würden 25 Nutzer weniger irgendeinen Effekt hinsichtlich der Performance der Wikipedia an einem solchen Tag mit schlechter Erreichbarkeit bringen?
Die Frage kann ich nicht qualifiziert beantworten, aber ich würde es nicht von vornherein ausschliessen.
Zum Vergleich: Im Oktober waren täglich 126.000 User bei der deutschen Wikipedia, bei einer angenommenen Gleichverteilung sind das 5250 User pro Stunde (Tag-Nacht-Rhythmus außen vor gelassen). Ich bin der Meinung, dass da die paar Änderungen nicht so stark ins Gewicht fallen.
Naja, wenn Du dich meiner Auffassung mit 50 mal schneller anschliessen kannst sind das 250 Benutzer. Änderungen brauchen auch wesentlich länger als Lesen (Du Profitierst nicht von Chaches, Die Datenbank muß locken, Indizes müssen korrigiert werden...) ich hab bei meinen Datenbanken oft ca. das 3 fache. Wenn es stimmt, daß nur ein vernachlässigbarer Teil der Nutzer auch ändert, dann vernachlässige ich den mal und komme auf 750 Nutzerlasten durch 5 Bots. Das sind ca. 15% Zusatzlast und das fände ich relevant (Besonders wenn man bedenkt, daß Performance sich schlechter als linear mit steigender Last verhält). Aber das sind alles Schätzungen, kann sein, daß ich ganz weit daneben liege, aber mein Gefühl sagt mir eigentlich, daß das in etwa hinkommt.
Aber bezüglich Tag-Nacht-Rhytmus: Auf jeden Fall könnte man Bots ja auf die Zeit 4:00 - 6:00 (oder so) beschränken um nicht in den Lastspitzen zusätzliche Last zu produzieren. Da Bots nicht schlafen sollte das ja kein Problem sein ;-)
Oliver Hankeln