-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Hallo Liste.
Soeben lese ich auf Heise[1], dass auf den hundert populärsten Websites ausnahmslos mindestens ein Web-Bug (kleine Datei zum Analysieren des Traffics) hinterlegt ist. Da Wikipedia seit einiger Zeit unter den hundert populärsten Websites rangieren dürfte, müsste demnach auch Wikipedia den Traffic der Benutzer aufzeichnen/analysieren.
1. Das erstaunt mich massiv. 2. Das fänd ich -- gerade in nicht-kommunizierter Form -- absolut fehlplatziert.
Weiß da jmd. genaueres? Ist die Meldung eine Ente oder zeichnet Wikipedia tatsächlich mit Hilfe externer Anbieter den Benutzertraffic auf?
Gruß, norro
[1] http://www.heise.de/newsticker/Studie-Google-fuehrend-bei-Web-Bug-Nutzung--/...
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Hallo Norro,
bitte richtig lesen, das ist nur bei 92 der 100 Websites der Fall. Trotzdem ist eine Falschinformation drin, es wird behaupted dass es bei den Top-50 ausnahmslos der Fall sei. Mit Bordmitteln lässt sich zweifelsfrei feststellen, dass es bei Wikipedia nicht der Fall ist.
Gruß
Am Wed, 03 Jun 2009 21:34:12 +0200 schrieb norro mail@norro.de:
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Hallo Liste.
Soeben lese ich auf Heise[1], dass auf den hundert populärsten Websites ausnahmslos mindestens ein Web-Bug (kleine Datei zum Analysieren des Traffics) hinterlegt ist. Da Wikipedia seit einiger Zeit unter den hundert populärsten Websites rangieren dürfte, müsste demnach auch Wikipedia den Traffic der Benutzer aufzeichnen/analysieren.
- Das erstaunt mich massiv.
- Das fänd ich -- gerade in nicht-kommunizierter Form -- absolut
fehlplatziert.
Weiß da jmd. genaueres? Ist die Meldung eine Ente oder zeichnet Wikipedia tatsächlich mit Hilfe externer Anbieter den Benutzertraffic auf?
Gruß, norro
[1] http://www.heise.de/newsticker/Studie-Google-fuehrend-bei-Web-Bug-Nutzung--/... -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.9 (GNU/Linux)
iEYEARECAAYFAkom0CwACgkQRawDj1XqbtzmnQCfUL57GwCpIiVm/oTthD8kfIDR ZEUAniF72iUFzHZiDmq8ySEk9MN7Ht3p =JJm+ -----END PGP SIGNATURE-----
WikiDE-l mailing list WikiDE-l@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikide-l
- --
Hallo,
Am 3. Juni 2009 21:34 schrieb norro mail@norro.de:
Soeben lese ich auf Heise[1], dass auf den hundert populärsten Websites ausnahmslos mindestens ein Web-Bug (kleine Datei zum Analysieren des Traffics) hinterlegt ist. Da Wikipedia seit einiger Zeit unter den hundert populärsten Websites rangieren dürfte, müsste demnach auch Wikipedia den Traffic der Benutzer aufzeichnen/analysieren.
- Das erstaunt mich massiv.
- Das fänd ich -- gerade in nicht-kommunizierter Form -- absolut
fehlplatziert.
Weiß da jmd. genaueres? Ist die Meldung eine Ente oder zeichnet Wikipedia tatsächlich mit Hilfe externer Anbieter den Benutzertraffic auf?
Die Aussage "Insgesamt enthielten alle der 50 am meisten gefragten Webseiten während eines Monats zumindest einen Web-Bug oder andere Tracking-Instrumente." ist meiner Einschätzung nach falsch, da dies nicht auf die Wikipedia zutrifft. Heise ist hier allerdings kein Vorwurf zu machen, da diese Aussage so explizit im Executive Summary des Reports vorhanden ist: "All of the top 50 websites contained at least one web bug at some point in a one month time period."
Der komplette Report von KnowPrivacy findet sich hier: http://knowprivacy.org/report/KnowPrivacy_Final_Report.pdf
Der einzige Bezug zur Wikipedia, die laut Quantcast-Zählung die acht-meistbesuchte Website weltweit ist (wobei http://www.quantcast.com/wikipedia.org explizit darauf hinweist, dass Quantcast das nur schätzt, da kein Quantcast-Webbug vorhanden ist: "Site Not Quantified - Data is based on Rough Estimate"), findet sich im folgenden Satz: "However, 49 of the top 50 also collect some form of contact information, such as name, address, or phone number (the only exception is Wikipedia, for whom contact information is optional for site registration – users can make edits pseudo-anonymously using only an IP address as an identifier)."
Ich versuche schnellstmöglich einen Kontakt zu KnowPrivacy herzustellen und eine Begründung für die entsprechende Behauptung zu bekommen.
In der Vergangenheit gab es einmal einen "eigenen" Webbug bei einem Tools von Leon, dass in der deutschsprachigen Wikipedia mit einer Wahrscheinlichkeit von ~1/500, dass aktuell aufgerufene Lemma gezählt hat und somit anonym die meistabgerufenen Seiten hochgerechnet hat. Dieses Tool ist meiner letzten Information nach seit 2007 eingestellt. Kontakt zu Leon versuche ich morgen herzustellen. Ebenso gab es immer mal wieder kleinere private Projekte, die versuchst haben, via Google Analytics Daten zu erfassen. Dieses Verhalten wurde aber immer umgehend nach dem es bekannt wurde deaktiviert.
Tschüss, Tim.
Hi,
Am 4. Juni 2009 00:49 schrieb Tim 'avatar' Bartel wikipedia@computerkultur.org:
Die Aussage "Insgesamt enthielten alle der 50 am meisten gefragten Webseiten während eines Monats zumindest einen Web-Bug oder andere Tracking-Instrumente." ist meiner Einschätzung nach falsch, da dies nicht auf die Wikipedia zutrifft.
Ich habe die Nacht mit Brian W. Carver (University of California) Kontakt aufgenommen, der mich an David Cancel (den Maintainer der genutzten Software Ghostery) verwiesen hat, welcher die entsprechenden Daten geliefert hat. Während ich Brians Aussage "If I recall correctly there was only a single web bug detected on the wikipedia domain in the month of March 2009, and perhaps David can point us to the specific page. We did not investigate this data point, but hypothesized that, since Wikipedia allows user-contributed content, that an end-user might have placed such a web bug on a page somewhere." noch vergleichsweise beruhigend fand, hat sich David dem noch mal angenommen und festgestellt: "The following web bug trackers were reported to us, on the following subdomains: Google Analytics - vls.wikipedia.org Doubleclick - hu.wikipedia.org Both were seen in yesterday's data so they're recent. We don't receive any page level information so that's as much detail as we have. Hope that helps."
Unter vls residiert die flämische Wikipedia, unter hu die ungarische. Bei der flämischen WP scheint auch direkt mit der Hauptseite schon ein GA web bug ausgeliefert zu werden. Bei der ungarischen konnte ich noch nicht nachvollziehen, wo dort ein Doubleclick web bug sein soll. Ich kläre das und spreche mit Brion - und gehe momentan davon aus, dass es in Kürze abgeschaltet wird.
Tschüss, Tim.
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Hallo Tim
Tim 'avatar' Bartel schrieb:
Google Analytics - vls.wikipedia.org Doubleclick - hu.wikipedia.org
Unter vls residiert die flämische Wikipedia, unter hu die ungarische. Bei der flämischen WP scheint auch direkt mit der Hauptseite schon ein GA web bug ausgeliefert zu werden. Bei der ungarischen konnte ich noch nicht nachvollziehen, wo dort ein Doubleclick web bug sein soll. Ich kläre das und spreche mit Brion - und gehe momentan davon aus, dass es in Kürze abgeschaltet wird.
Die Bugs aus den beiden Wikipedias zu entfernen halte ich auch für den richtigen Weg.
Danke für die Klarstellung und getriebenen Rechercheaufwand.
Gruß, norro
Hallo, Am Thursday 04 June 2009 00:49:22 schrieb Tim 'avatar' Bartel:
In der Vergangenheit gab es einmal einen "eigenen" Webbug bei einem Tools von Leon, dass in der deutschsprachigen Wikipedia mit einer Wahrscheinlichkeit von ~1/500, dass aktuell aufgerufene Lemma gezählt hat und somit anonym die meistabgerufenen Seiten hochgerechnet hat. Dieses Tool ist meiner letzten Information nach seit 2007 eingestellt.
wobei hier zu erwähnen ist, dass keine IP-Adressen mitgeloggt wurden. Es wurde einiger Aufwand getrieben um es TS-Benutzern unmöglich zu machen, die IP- Adressen oder andere private Daten zu sehen (TS-Admins hätten theorethisch den Traffic mitsniffern können).
Das Tool wurde eingestellt nachdem bessere Statistiken verfügbar wurden die direkt auf den Wikimedia-Squiad-Daten gewonnen werden (natürlich auch anonym AFAIK).
Mit freundlichen Grüßen DaB.
Hi,
Am 03.06.2009, 21:34 Uhr, schrieb norro mail@norro.de:
Weiß da jmd. genaueres? Ist die Meldung eine Ente oder zeichnet Wikipedia tatsächlich mit Hilfe externer Anbieter den Benutzertraffic auf?
ein Blick in das Original-Dokument [1] bringt ein wenig Klarheit. Da findet sich z.B.:
All 50 collect computer information such as IP address or type of operating system. This is expected, as this type of information is automatically collected by most server logs and useful in investigating security breaches or attacks.
Die Top-50-Seiten benutzen also nicht unbedingt Web-Bugs, sondern speichern nur die IPs der Zugriffe in Weblogs. Das ist aber bekannt und nichts neues und wie der Text sagt: auch normal und z.T. nötig.
Es findet sich aber auch:
However, 49 of the top 50 also collect some form of contact information, such as name, address, or phone number (the only exception is Wikipedia, for whom contact information is optional for site registration – users can make edits pseudo-anonymously using only an IP address as an identifier).
Wir werden also sogar positiv genannt ;)
Grüße, Christian Thiele / APPER
[1] http://knowprivacy.org/report/KnowPrivacy_Final_Report.pdf