Hallo Wikipedianer,
gestern kurz nach 12:00 Uhr habe ich die Wikipedia-DVD-Download-Seite mit den aktuellen Daten der Wikipedia-DVD bestueckt. Gut 24 Stunden spaeter ist ein guter Zeitpunkt um mal zu schauen, wie denn der Bedarf an der Wikipedia-DVD aussieht. Man darf guten Gewissens sagen, dass die Verteilung dieses mal deutlich besser geklappt hat als in der Vergangenheit.
Insgesamt haben wir mit etwa 35 potentiellen Mirror-Betreibern Kontakt aufgenommen und an ~15 davon im Vorfeld ueber einen Distributionsserver die DVD-Dateien per HTTP, FTP, rsync und BitTorrent verteilt. Manuel hatte ueber verschiedene Fachlisten (GUUG, Linux-Verband, WilhelmTux, PingoS...) angefragt und ich die ehemaligen Mirror-Betreiber und einige weitere "typische" Mirror-Anbieter angeschrieben.
Der Zaehler der FTP- und HTTP-Downloads, die ueber das Download-Rotations-Skript von Manuel Schneider gestartet wurden, liegt momentan bei 35.000. Dazu muss man sagen, dass vermutlich nicht alle Downloads auf Nutzerseite bis zum Ende durchgefuehrt wurden.
Zum Gebrauch der DVD benoetigt man zwingend die Basisdatei wikipedia.zeno. Dieser Download wurde 10.000 mal gestartet. Von den Mirrors haben wir gehoert, dass sie ordentlich ausgelastet sind:
* "Perfekt. Wir schieben z.Z. 50MBit/s raus mit der DVD."
* "Also läuft wunderbar mit dem download, seitdem es in den heise news war hab ich durchgänig ca 180-250 Mbit outgoing und 250 user. Wollte euch nur mal einen kurzen überblick geben."
Aufgrund der geringen Anzahl an HTTP-Mirrorn (wir stocken gerade noch um einen weiteren auf: "Der Mirror sind zwei redundante SunServer, mit RAID und einer schnellen Anbindung (2x 2,4GB / 100BaseT) direkt im Rechenzentrum.") waren diese auch schon mal platt - Michael Diederich, der einen davon anbietet, kann davon ein Liedchen singen.
An der P2P-Front sieht es auch ganz gut aus. Wir hatten vorab dafuer gesorgt, dass ~10 komplette Seeds zur Verfuegung standen - dies hat den Einfall der Sauger-Horden nach der Veroeffentlichung bei Heise und Golem etwas abgefangen. Momentan haben wir 150 Peers (=Rechner die downloaden) und 36 Seeds (=Rechner, die 100% der Dateien anbieten). Diese Nacht waren es ueber 550 Peers und 45 Seeds. Die .torrent-Datei wurde 3.700 mal downgeloaded.
Alleine der Distributionsserver hat ueber 100 GB Traffic erzeugt. Michael hat per BT ueber 200 GB geseeded und noch mal deutlich mehr per HTTP verteilt.
Ein paar schoene Bildchen koennen dank Leon Weber hier bestaunt werden: http://vserver152.masterssystems.com/graphs/dvd/dvd-daily.png http://vserver152.masterssystems.com/graphs/dvd/dvd-hourly.png
Und Webzugriffs-Statistiken sind hier zu finden: http://statistik.mastersadmin.com/awstats.pl?config=u00008
Soviel der Zahlenspielerei, in ein paar Tagen noch mal mehr dazu...
Tschuess, Tim.
Gibt es auch Stats für den Esel (ed2k)? Ich sehe bei mir gerade im Schnitt 60 Quellen / Datei. Wie's allerdings mit dem Traffic aussieht wäre aber interesant.
Grüsse, Marco
Hi Wikipedianer,
Marco Schuster schrieb am 07.12.2006 17:12:
Gibt es auch Stats für den Esel (ed2k)? Ich sehe bei mir gerade im Schnitt 60 Quellen / Datei. Wie's allerdings mit dem Traffic aussieht wäre aber interesant.
Nicht von mir - ich hatte die urspruengliche Verteilung angeschubst, dann aber den Esel zugunsten von BitTorrent wieder abgeschaltet.
Tschuess, Tim.
Gibt es auch Stats für den Esel (ed2k)? Ich sehe bei mir gerade im Schnitt 60 Quellen / Datei. Wie's allerdings mit dem Traffic aussieht wäre aber interesant.
Nicht von mir - ich hatte die urspruengliche Verteilung angeschubst, dann aber den Esel zugunsten von BitTorrent wieder abgeschaltet.
Bei mir gingen seit gestern Morgen knapp 80 GB über den Esel, er spricht von 26 vollständigen Quellen für base.zip und 17 Quellen für images.zip.
Ich halte den öffentlichen Zugang zur AwStats Logdateienauswertung für bedenklich und nicht konform mit den Ausführungen unter [[Wikipedia:Datenschutz]].
* http://de.wikipedia.org/wiki/Wikipedia:Datenschutz * http://statistik.mastersadmin.com/awstats.pl?config=u00008&output=allhos...
HeinzJ
Hallo, Am Donnerstag, den 07.12.2006, 22:53 +0100 schrieb HeinzJ:
Ich halte den öffentlichen Zugang zur AwStats Logdateienauswertung für bedenklich und nicht konform mit den Ausführungen unter [[Wikipedia:Datenschutz]].
die Seite ist nicht teil der Wikipedia oder eines sonstigen Wikimedia-Projektes. Da gelten die Wikipedia-Datenschutzangaben selbstverständlich nicht.
Du kannst aber vllcht. den Besitzer *höfflich* bitten, die Seite zu verändern.
HeinzJ
Mit freundlichen Grüßen DaB.
Ich halte den öffentlichen Zugang zur AwStats Logdateienauswertung für bedenklich und nicht konform mit den Ausführungen unter [[Wikipedia:Datenschutz]].
Die Logfileauswertung ist insofern unbedenktlich da es sich um öffentliche Software handelt - die Auswertung an sich wäre immer bedenklich, egal ob öffentlich oder nicht.
Personenbezogene Daten sind lediglich IP-Adressen. Diese werden aber mit keinen weiteren Daten verknüpft und sind somit nur für statistische Zwecke zu gebrauchen. Hinzu kommt, dass eine IP-Adresse immer öffentlich ist.
Abgerufene Dateien, Referer, Suchausdrücke etc. sind in der Auswertung alle nicht mehr personenbezogen.
Etwas anderes gilt für die Logfiles, aber auf die hat keiner Zugriff.