Stefan Kühn schrieb:
Das wäre auch jetzt schon möglich, da die Bot ja als
Benutzer der Wikipedia
bekannt sind. Ihre Änderungen werden z.B. deshalb ja nicht mehr in der Liste
der letzten Änderungen aufgenommen.
Das war mir nicht bekannt.
Ist das nötig? Nehmen wir mal an 5 Bots arbeiten
gleichzeitig an der
Wikipedia. Jeder von ihnen arbeitet vielleicht fünfmal so schnell wie ein
menschlicher User. Heiß also sie simulieren 25 Nutzer.
Ich habe keinen eigenen Bot am laufen, aber ein Programm sollte doch
maximal 200ms für ne Änderung brauchen (+ Wikipedia Wartezeit natürlich)
und das ist eher 50 mal schneller als 5 mal schneller.
Meine Frage ist dann: Würden 25 Nutzer weniger
irgendeinen Effekt
hinsichtlich der Performance der Wikipedia an einem solchen Tag mit
schlechter Erreichbarkeit bringen?
Die Frage kann ich nicht qualifiziert beantworten, aber ich würde es nicht
von vornherein ausschliessen.
Zum Vergleich: Im Oktober waren täglich 126.000 User
bei der deutschen
Wikipedia, bei einer angenommenen Gleichverteilung sind das 5250 User pro
Stunde (Tag-Nacht-Rhythmus außen vor gelassen). Ich bin der Meinung, dass
da
die paar Änderungen nicht so stark ins Gewicht fallen.
Naja, wenn Du dich meiner Auffassung mit 50 mal schneller anschliessen
kannst sind das 250 Benutzer. Änderungen brauchen auch wesentlich länger
als Lesen (Du Profitierst nicht von Chaches, Die Datenbank muß locken,
Indizes müssen korrigiert werden...) ich hab bei meinen Datenbanken oft
ca.
das 3 fache. Wenn es stimmt, daß nur ein vernachlässigbarer Teil der
Nutzer auch ändert, dann vernachlässige ich den mal und komme auf 750
Nutzerlasten durch 5 Bots. Das sind ca. 15% Zusatzlast und das fände ich
relevant (Besonders wenn man bedenkt, daß Performance sich schlechter als
linear mit steigender Last verhält).
Aber das sind alles Schätzungen, kann sein, daß ich ganz weit daneben
liege, aber mein Gefühl sagt mir eigentlich, daß das in etwa hinkommt.
Aber bezüglich Tag-Nacht-Rhytmus: Auf jeden Fall könnte man Bots ja auf
die Zeit 4:00 - 6:00 (oder so) beschränken um nicht in den Lastspitzen
zusätzliche Last zu produzieren. Da Bots nicht schlafen sollte das ja kein
Problem sein ;-)
Oliver Hankeln