Na sowas - war ich das Wochenende nicht da und schon geht gar nichts mehr.
Wo gibt es eigentlich Wikipedia-Mirror, die z.B. stündlich geupdates werden?
Notwendig ist doch nur, regelmäßig per RSS die Liste der letzten Änderungen zu verfolgen und die geänderten Artikel mittels XML-Exportfunktion herunterzuladen. Die Versionsgeschichte kann dabei nicht vollständig fehlerfrei übenommen werden, aber dazu kann ja auf die Orginal-Wikipedia verwiesen werden.
Bei den so aktuell gehaltenen Spiegeln müsste natürlich die Bearbeitungsfunktion abgeschaltet werden, aber dafür könnte man die Spiegel-Server neben dem reinen Lesen für die Spezialfunktionen nutzen (erinnert sich noch jemand an "Suche" und "SQL-Queries"?). Wiki-prinzip hin oder her, aber eine nicht-bearbeitbare Version von vor einigen Minuten/Stunden/Tagen ist immer noch besser als ein nicht-verfügbares oder schnarchlangsames Original. Langsame Phasen oder sogar Ausfälle sind in der Vergangenheit immer wieder vorgekommen, also sollten standardmäßig schnelle und stabile Ausfallsysteme im nur-lese-Modus angeboten werden und nicht erst wenn es mal wieder brennt.
Ich denke an sowas wie:
1h.de.wikipedia-mirrors.org 24h.de.wikipedia-mirrors.org suchen.de.wikipedia-mirrors.org uniserver-xy.de.wikipedia-mirrors.org ...
Wenn eine einfache Methode angeboten wird, einen solchen Spiegel einzurichten und offiziell zu registrieren, könnte man bestimmt einige Unis und Organisisationen dazu überreden, eine Kopie zu hosten.
Gruss, Jakob
Jakob wrote:
Ich denke an sowas wie: 1h.de.wikipedia-mirrors.org 24h.de.wikipedia-mirrors.org suchen.de.wikipedia-mirrors.org uniserver-xy.de.wikipedia-mirrors.org ...
Nette Domain-Namen. Allerdings bräuchte man erstmal jemanden, der so einen Mirror aufbaut und instandhält. Offenbar hat das bisher noch niemand gemacht (jedenfalls nicht für den spezifischen Zweck, Downtime zu präempten).
Mit schlechtendeutschesaufgründiger Entschuldigung, Timwi
Timwi schrieb:
Nette Domain-Namen. Allerdings bräuchte man erstmal jemanden, der so einen Mirror aufbaut und instandhält. Offenbar hat das bisher noch niemand gemacht (jedenfalls nicht für den spezifischen Zweck, Downtime zu präempten).
Da müsste sich wahrscheinlich wirklich eine universitäre Einrichtung oder so hervortun, um die Hardware und Bandbreite zu stellen.
Ich zum Beispiel habe nicht erst seit gestern immer mal wieder darüber nachgedacht, ob ich nicht einen Server anmiete und darauf eine deutsche Wikipedia mit den wöchentlichen Dumps aufspiele, nicht um damit Geld zu verdienen wie unsere Kollegen GFDL-Brecher, sondern um dann Funktionen wie Wartungsseite oder Suche öffentlich anzubieten, damit die Leute auch mal wieder Typos in unserer Wikipedia finden und korrigieren können. Die Firma Hetzner hat zum Beispiel seit neuestem in der Einstiegsklasse einen Server mit 1 GB RAM und 160 GB Traffic für 39 Kröten, das wäre für die deutsche Wikipedia genau richtig.
Was mich davon abgehalten hat, war neben der Kostenfrage hauptsächlich ein Szenario, wie wir es jetzt momentan haben, nämlich dass die echte Wikipedia offline ist, und sich herumspricht, dass es da irgendwo einen funktionsfähigen Mirror gibt. Der Server würde wahrscheinlich genagelt, geDOSt oder was auch immer werden, und möglicherweise würde ich an der entstehenden Traffic-Rechnung pleite gehen (wieviel Traffic macht die deutsche Wikipedia im Monat wohl? Das möchte ich nicht im Selbstversuch ausprobieren...).
Ich für meinen Teil würde mir jemanden wünschen, der wenigstens die schlimmsten Risiken irgendwie abfedert, dann würde ich mich auch als Administrator, Entwickler, Instandhalter oder sonstwas hergeben, keine Frage. Das könnte die besagte Uni sein, oder vielleicht auch später mal der in der Gründung befindliche Verein. Wenn wir diese Mirror-Lösung "in-house" entwickeln, sollte es nicht allzu schwer sein, Unterstützung dafür zu finden, als wenn Alwin Meschede (wer ist Alwin Meschede?) sich auf die Suche nach einem warmen Plätzchen für einen selbstgestrickten Mirror der Wikipedia macht...
Ja, vielleicht könnte man sich aber auch mit Denjenigen besser einigen, die die Wikipedia.de jetzt schon spiegeln wollen - aus welchen Gründen auch immer - dass sie bei jedem Artikel auch das letzte Aktuallisierungsdatum (Zum Beispiel: dieser Artikel aus der www.Wikipedia.de wurde am 12. Mai 2004 zum letztenmal aktuallisiert") angeben und das die Verlinkung mit den entsprechenden Artikeln in der Wikipedia.de (zur Bearbeitung) vorhanden ist. Wenn also schon gespiegelt wird, dann aber bitte "richtig" und regelmässig, damit hätte man auch eine Art Backup der Wikipedia. Das wäre doch im Interesse von beiden Seiten?
Ilja
----- Original Message ----- From: "Alwin Meschede" ameschede@gmx.de To: "Mailingliste der deutschsprachigen Wikipedia" wikide-l@Wikipedia.org Sent: Monday, June 07, 2004 10:14 PM Subject: Re: [Wikide-l] Wikipedia-Mirrors
Timwi schrieb:
Nette Domain-Namen. Allerdings bräuchte man erstmal jemanden, der so einen Mirror aufbaut und instandhält. Offenbar hat das bisher noch niemand gemacht (jedenfalls nicht für den spezifischen Zweck, Downtime zu präempten).
Da müsste sich wahrscheinlich wirklich eine universitäre Einrichtung oder so hervortun, um die Hardware und Bandbreite zu stellen.
Ich zum Beispiel habe nicht erst seit gestern immer mal wieder darüber nachgedacht, ob ich nicht einen Server anmiete und darauf eine deutsche Wikipedia mit den wöchentlichen Dumps aufspiele, nicht um damit Geld zu verdienen wie unsere Kollegen GFDL-Brecher, sondern um dann Funktionen wie Wartungsseite oder Suche öffentlich anzubieten, damit die Leute auch mal wieder Typos in unserer Wikipedia finden und korrigieren können. Die Firma Hetzner hat zum Beispiel seit neuestem in der Einstiegsklasse einen Server mit 1 GB RAM und 160 GB Traffic für 39 Kröten, das wäre für die deutsche Wikipedia genau richtig.
Was mich davon abgehalten hat, war neben der Kostenfrage hauptsächlich ein Szenario, wie wir es jetzt momentan haben, nämlich dass die echte Wikipedia offline ist, und sich herumspricht, dass es da irgendwo einen funktionsfähigen Mirror gibt. Der Server würde wahrscheinlich genagelt, geDOSt oder was auch immer werden, und möglicherweise würde ich an der entstehenden Traffic-Rechnung pleite gehen (wieviel Traffic macht die deutsche Wikipedia im Monat wohl? Das möchte ich nicht im Selbstversuch ausprobieren...).
Ich für meinen Teil würde mir jemanden wünschen, der wenigstens die schlimmsten Risiken irgendwie abfedert, dann würde ich mich auch als Administrator, Entwickler, Instandhalter oder sonstwas hergeben, keine Frage. Das könnte die besagte Uni sein, oder vielleicht auch später mal der in der Gründung befindliche Verein. Wenn wir diese Mirror-Lösung "in-house" entwickeln, sollte es nicht allzu schwer sein, Unterstützung dafür zu finden, als wenn Alwin Meschede (wer ist Alwin Meschede?) sich auf die Suche nach einem warmen Plätzchen für einen selbstgestrickten Mirror der Wikipedia macht... _______________________________________________ WikiDE-l mailing list WikiDE-l@Wikipedia.org http://mail.wikipedia.org/mailman/listinfo/wikide-l
Alwin Meschede wrote:
[ Hetzner Entry Server ]
und möglicherweise würde ich an der entstehenden Traffic-Rechnung pleite gehen [...]? Das möchte ich nicht im Selbstversuch ausprobieren...).
Das zumindest sollte bei Hetzner kein Problem sein, da gibt es ein Tool, um Traffic zu limitieren. Zumal es sich dabei um einen Rootserver handelt, sollte man zusätzlich auch ein eigenes Monitoring oder -Shaping implementieren können, das den Traffic ab einem Schwellert drosselt oder abschaltet -- wenn man sich denn wirklich die kontinuierliche Administration einer *sicheren* Linux-Büchse ans Bein binden will...
Das Problem bei dem Entry-Angebot von Hetzner sehe ich eher in Debian 3.0, worunter Mediawiki nicht läuft. Du müsstest da auf Sarge oder gar Sid gehen bzw. Backports verwenden oder abgefahrene Mix-Konfigurationen fahren. Zumindest bei Sid sollte man *sehr* fit in Debian sein, ich habe damit jedenfalls (als Debian-Laie) wenig Spass, dafür läuft Mediawiki problemlos.
Wenn man wirklich einen solchen Mirror haben wollte, wäre das nicht eher eine Aufgabe für den Verein?
MfG -asb