Hallo Mailingliste,
On Montag, 17. November 2003, you wrote:
UF> Am Sonntag, 16. November 2003 21:48 schrieb Karl Eichwalder:
Andreas Voß AndrsVoss@yahoo.de writes:
Der Bot wurde auch auf die deutsche Wikipedia angesetzt. Das Ergebnis der ersten Anwendung und die Möglichkeit zur Mitarbeit an der Einarbeitung der gefundenen, fehlenden interwikis findet man unter
http://de.wikipedia.org/wiki/Benutzer_Diskussion:Rob_Hooft/Hilfe_bitte
Klasse - jetzt geht für den Normaluser mal wieder gar nichts :-(
UF> Korrekt, der Bot gehört abgeschaltet.
Zur Klärung: Der Bot wurde auf der deutschen Wikipedia noch gar nicht eingesetzt!
Die Liste ist das Resultat eines Durchlaufs auf der niederländischen Wikipedia (oder ihrem SQL-Dump). Sie zeigt Artikel, bei denen die deutsche Wikipedia andere/weniger Interwiki-Links hat als die niederländische.
UF> Sprachlinks nach Holländisch sind ein Nice-To-Have, Performance UF> ein Muss. Und alles, was über die Datenbank ackert, um UF> nice-to-haves zu erzeugen, ist im Moment zu viel.
Interwiki-Links finde ich schon wichtig (es geht nicht nur um holländische!). Sie helfen beim Erweitern von Artikeln, da man die anderssprachigen Seiten als Quelle verwenden kann (d.h. Absätze übersetzen, Bilder übernehmen, Zahlenwerte vergleichen, Ideen für Umsetzung/Layout etc.). Und ganz nebenbei verbessern sie auch das Google-Ranking.
Natürlich kann man weiterhin den Bot mit den SQL-Dumps füttern und die Liste manuell abarbeiten. Allerdings ist das sehr aufwendig, ich will gar nicht wissen, wie viele Mann-(/Frau-)stunden nötig waren, um die jetzige Liste so weit abzuarbeiten.
Das mit der Performance ist natürlich ein Argument. Wenn man den Bot vollautomatisch laufen ließe, würde er die Wikipedia wahrscheinlich stark verlangsamen. Allerdings kann man ihn in einem manuellen Modus betreiben, in dem jede Änderung einzeln bestätigt werden muss. Wenn man nach jeder Bestätigung einige Zeit wartet, dann haben die Bot-Aktivitäten praktisch keine Auswirkung auf die Performance. Außerdem kann man jederzeit abbrechen, wenn man merkt, dass die Performance doch leidet.
Ich habe Brion im Chat gefragt: "does anyone know how much rob's interwiki bot would affect database performance when run on de.wikipedia?" Seine Antwort:
brion> just don't run it too terribly fast. brion> give at least a minute or two between hits brion> and preferably run it at low traffic times, but that's less an issue now brion> early morning in europe is good
Mein Kompromissvorschlag wäre, die jetzige Liste noch manuell abzuarbeiten; bis das fertig ist, dürfte der neue Datenbankserver eingetrudelt sein, dann würde ich mich bereiterklären, den Bot zu steuern (bräuchte natürlich Einarbeitungszeit).
Daniel