Laut http://de.wikipedia.org/wiki/Wikipedia:Relevanz#Negative_Relevanz_-_Wikipedi... wurde die Zugriffsstatistik der deutschen WP deaktiviert. Die verwundert mich doch ein wenig. Besteht kein Interesse am Leserinteresse zu einzelenen Artikeln? Wird diese Information einfach nicht mehr zur Verfügung gestellt aber vielleicht trotzdem noch gezählt?.
???
Grüße, Heinz
Am 12.09.2005 um 00:38 schrieb Heinz:
Laut http://de.wikipedia.org/wiki/Wikipedia:Relevanz#Negative_Relevanz_- _Wikipedia_Zugriffsstatistik wurde die Zugriffsstatistik der deutschen WP deaktiviert. Die verwundert mich doch ein wenig. Besteht kein Interesse am Leserinteresse zu einzelenen Artikeln? Wird diese Information einfach nicht mehr zur Verfügung gestellt aber vielleicht trotzdem noch gezählt?.
Das muss ich etwas ausholen. Einen Zugriffszähler den man in der Datenbank pro Seite speichert erfordert mit jedem Zugriff auch ein hochzählen des Zählers, also einen Zugriff auf die Datenbank. Das geht gut wenn nicht viel los ist, aber bei der Wikipedia war's halt schon 2003 der Fall dass die Performance da nicht mehr gut war. Ausserdem kann man dadurch dass man Seiten aus dem Cache ausliefert auch gar keinen Zähler mehr mitführen.
Das ganze darf man aber nicht verwechseln mit Daten die man aus den Apache / Squid-Accesslogs gewinnt. Diese stimmen hundertprozentig, wurden aber aufgrund akuten Platzmangels nicht immer zur Verfügung gestellt bzw. ausgewertet. In den guten alten Tagen wurden diese Logs immer mit dem webalizer ausgewertet, heute hat man aber so neumodisches Zeugs: http://www2.knams.wikimedia.org/logwood/logwood.php? site=de.wikipedia.org
aus den TOP100 sind 15 Begriffe die im weiten Rahmen mit Sex und der menschlichen Anatonie zu tun haben... Biologie nicht mitgezählt.
gut nacht, tom -- http://de.wikipedia.org/wiki/Benutzer:TomK32 http://www.tomk32.de
Hi Wikipedianer,
Thomas Koll schrub:
Das ganze darf man aber nicht verwechseln mit Daten die man aus den Apache / Squid-Accesslogs gewinnt. Diese stimmen hundertprozentig,
wurden aber
aufgrund akuten Platzmangels nicht immer zur Verfügung gestellt bzw.
ausgewertet.
Ich bin zwar sicher, dass du das weisst, aber damit bei Lesern deines Postings erst gar keine falschen Vorstellungen aufkommen, moechte ich nochmal darauf hinweisen, dass die Logs moeglicherweise hunderprozentig stimmen, aber mitnichten hundertprozentig angeben, wie oft auf einen Artikel zugegriffen wurde. Solche Aussagen sind generell hoechst-problematisch, da man externe Proxies und Browsercaches (und Wikipedia CDs und DVDs, und Mirrors, und ...) nicht beruecksichtigen kann und somit kann auch aus diesen Statistiken immer nur eine ungefaehre Groessenordnung geschaetzt werden.
Tschuess, Tim.
Am 12.09.2005 um 07:43 schrieb Tim 'avatar' Bartel:
Thomas Koll schrub:
schrub?
Ich bin zwar sicher, dass du das weisst, aber damit bei Lesern deines Postings erst gar keine falschen Vorstellungen aufkommen, moechte ich nochmal darauf hinweisen, dass die Logs moeglicherweise hunderprozentig stimmen, aber mitnichten hundertprozentig angeben, wie oft auf einen Artikel zugegriffen wurde. Solche Aussagen sind generell hoechst-problematisch, da man externe Proxies und Browsercaches (und Wikipedia CDs und DVDs, und Mirrors, und ...) nicht beruecksichtigen kann und somit kann auch aus diesen Statistiken immer nur eine ungefaehre Groessenordnung geschaetzt werden.
Zumindest in der Statistik dürften die (online-Medien) kaum Gewicht haben, natürlich werden vorallem die häufig aufgerufenen Seiten gecacht, aber nachdem die Wikipedia eh enorme Zugriffszahlen verzeichnet und bei den meisten Browsern nur selten ein Proxy voreingestellt ist (und kaum ein DAU weiß überhaupt was ein Proxy ist).
ciao, tom (der so spät keine Mail mehr schreiben sollte)
-- http://de.wikipedia.org/wiki/Benutzer:TomK32 http://de.wikipedia.org/wiki/Wikipedia:WikiReader_Digest
Hi Wikipedianer,
Thomas Koll schrub:
schrub?
Ich bin zwar sicher, dass du das weisst, aber damit bei Lesern deines Postings erst gar keine falschen Vorstellungen aufkommen, moechte ich nochmal darauf hinweisen, dass die Logs moeglicherweise hunderprozentig stimmen, aber mitnichten hundertprozentig angeben, wie oft auf einen Artikel zugegriffen wurde.
[...]
Zumindest in der Statistik dürften die (online-Medien) kaum Gewicht haben, natürlich werden vorallem die häufig aufgerufenen Seiten gecacht, aber nachdem die Wikipedia eh enorme Zugriffszahlen verzeichnet und bei den meisten Browsern nur selten ein Proxy voreingestellt ist (und kaum ein DAU weiß überhaupt was ein Proxy ist).
Offline-Medien meinst du? Da hast du vermutlich recht.
IIRC hatte die CD eine Auflage von 50.000+ - ich gehe davon aus, dass die DVD eine hoehere Auflage hat. Im Vergleich zur Onlinenutzung sind das allerdings sicherlich nur die beruehmten Peanuts.
Bei der Einschaetzung zu Proxies wiederspreche ich allerdings. So ist hier sicherlich AOL zu beruecksichtigen, aber auch enorm viele Menschen, die von ihrem Arbeitsplatz aus die WP benutzen - und gerade in grossen Firmen/Forschungszentren/Stadtverwaltungen/Unis mit einer Vielzahl von Angestellten wirst du oftmals voreingestelle Proxies finden.
ciao, tom (der so spät keine Mail mehr schreiben sollte)
Ist doch frueh :-)
Tschuess, Tim.
Die Mirrors und DVDs sin aber mMn nicht relevant für die Statistik der "echten" Online-WP. Und das Problem mit den Proxies ist ja eigetlich eher zu vernachlässigen es sei denn der User ist bei America Offline etc. was heisst dass normalerweise jeder Benutzer einen Z8ugriff auf den Squids auslöst.Wenn man also alle Logs der Squids sammelt und auswertet, sollte dann eine recht aussagekräftige Statistik entstehen.
marco
-----Original Message----- From: wikide-l-bounces@Wikipedia.org [mailto:wikide-l-bounces@Wikipedia.org]On Behalf Of Tim 'avatar' Bartel Sent: Monday, September 12, 2005 7:44 AM To: Mailingliste der deutschsprachigen Wikipedia Subject: Re: [Wikide-l] Warum wurde der Zugriffszähler auf die Artikel deaktiviert?
Hi Wikipedianer,
Thomas Koll schrub:
Das ganze darf man aber nicht verwechseln mit Daten die man aus den Apache / Squid-Accesslogs gewinnt. Diese stimmen hundertprozentig,
wurden aber
aufgrund akuten Platzmangels nicht immer zur Verfügung gestellt bzw.
ausgewertet.
Ich bin zwar sicher, dass du das weisst, aber damit bei Lesern deines Postings erst gar keine falschen Vorstellungen aufkommen, moechte ich nochmal darauf hinweisen, dass die Logs moeglicherweise hunderprozentig stimmen, aber mitnichten hundertprozentig angeben, wie oft auf einen Artikel zugegriffen wurde. Solche Aussagen sind generell hoechst-problematisch, da man externe Proxies und Browsercaches (und Wikipedia CDs und DVDs, und Mirrors, und ...) nicht beruecksichtigen kann und somit kann auch aus diesen Statistiken immer nur eine ungefaehre Groessenordnung geschaetzt werden.
Tschuess, Tim.
WikiDE-l mailing list WikiDE-l@Wikipedia.org http://mail.wikipedia.org/mailman/listinfo/wikide-l
Tim 'avatar' Bartel schrieb:
... moechte ich nochmal darauf hinweisen, dass die Logs moeglicherweise hunderprozentig stimmen, aber mitnichten hundertprozentig angeben, wie oft auf einen Artikel zugegriffen wurde.
Ich kenne mich mit sowas zwar nicht aus, aber wenn ich mir die Statistik für de.wikisource ansehe (http://www2.knams.wikimedia.org/logwood/logwood.php?site=de.wikisource.org), dann würde ich mal darauf tippen, dass die Logs hundertprozentig falsch sind. Oder wie lässt sich erklären, dass beim Stundenzähler um 10 Uhr 0 Besuche, um 11 Uhr 2.514 Besuche und um 12 wieder keiner gezählt wird? Das gleiche bei den Tagen: Freitag 5.571, Samstag keiner, Sonntag 4.367.
Gruß Jofi
Hallo,
wenn die Zugriffzähler abgestellt sind, wie kan dann angegben werden, das Wikipedia zu den 50 meistgelesenen Websides in Deutschland gehört? Sind das nur die Zugriffe auf die Hauptseitze? Werden da überhaupt Zugriffe gezählt?
Was ist mit Zugriffen, die über Suchmaschinen direkt zugreifen?
Ausserdem kann man dadurch dass man Seiten aus dem Cache ausliefert auch gar keinen Zähler mehr mitführen.
Das finde ich nicht schlimm, da ja am besten nur Leser und nicht Zugriffe gleicher Leser gezählt werden sollten.
Grüsse - IP X
Am 12.09.2005 um 00:38 schrieb Heinz:
Laut http://de.wikipedia.org/wiki/Wikipedia:Relevanz#Negative_Relevanz_- _Wikipedia_Zugriffsstatistik wurde die Zugriffsstatistik der deutschen WP deaktiviert. Die verwundert mich doch ein wenig. Besteht kein Interesse am Leserinteresse zu einzelenen Artikeln? Wird diese Information einfach nicht mehr zur Verfügung gestellt aber vielleicht trotzdem noch gezählt?.
Das muss ich etwas ausholen. Einen Zugriffszähler den man in der Datenbank pro Seite speichert erfordert mit jedem Zugriff auch ein hochzählen des Zählers, also einen Zugriff auf die Datenbank. Das geht gut wenn nicht viel los ist, aber bei der Wikipedia war's halt schon 2003 der Fall dass die Performance da nicht mehr gut war. Ausserdem kann man dadurch dass man Seiten aus dem Cache ausliefert auch gar keinen Zähler mehr mitführen.
Das ganze darf man aber nicht verwechseln mit Daten die man aus den Apache / Squid-Accesslogs gewinnt. Diese stimmen hundertprozentig, wurden aber aufgrund akuten Platzmangels nicht immer zur Verfügung gestellt bzw. ausgewertet. In den guten alten Tagen wurden diese Logs immer mit dem webalizer ausgewertet, heute hat man aber so neumodisches Zeugs: http://www2.knams.wikimedia.org/logwood/logwood.php? site=de.wikipedia.org
aus den TOP100 sind 15 Begriffe die im weiten Rahmen mit Sex und der menschlichen Anatonie zu tun haben... Biologie nicht mitgezählt.
gut nacht, tom
http://de.wikipedia.org/wiki/Benutzer:TomK32 http://www.tomk32.de
WikiDE-l mailing list WikiDE-l@Wikipedia.org http://mail.wikipedia.org/mailman/listinfo/wikide-l
Hallo,
wikipedia.user@gmx.de schrieb am Thu, 22 Sep 2005 19:30:33 +0200:
wenn die Zugriffzähler abgestellt sind, wie kan dann angegben werden, das Wikipedia zu den 50 meistgelesenen Websides in Deutschland gehört? Sind das nur die Zugriffe auf die Hauptseitze? Werden da überhaupt Zugriffe gezählt?
Es wird gesagt, dass die Seite wikipedia.org mitsamt sämtlicher Sprachen zu den 50 größten Seiten des Internet weltweit gehören. Für Deutschland sind mir keine Zahlen bekannt. Die Zahl für die weltweiten Zugriffe stammen von Alexa [1], die Informationen über das Surfverhalten ihrer Toolbar-Benutzer auswerten. Allgemeine Webserver-Statistiken sind aber normalerweise unter [2] abrufbar (geht grad nicht - mein Fehler?). Es besteht ein großer Unterschied zwischen der Auswertung der Log-Dateien und eines manuellen Zählens bei jedem Zugriff.
Das finde ich nicht schlimm, da ja am besten nur Leser und nicht Zugriffe gleicher Leser gezählt werden sollten.
Alle Wikipedia-Seiten werden vollkommen "vorberechnet" auf Proxys gespeichert (die Software dazu heißt Squid) und wenn jemand uneingeloggtes eine Seite aufruft, bekommt er diese Seite, ohne, dass die richtigen Server, die Änderungen speichern etc., das überhaupt mitbekommen.
Mit freundlichen Grüßen Christian Thiele
[1] http://www.alexa.com [2] http://www2.knams.wikimedia.org/logwood/logwood.php?site=de.wikipedia.org
Am Donnerstag, 22. September 2005 19:30 schrieb wikipedia.user@gmx.de:
Was ist mit Zugriffen, die über Suchmaschinen direkt zugreifen?
Suchmaschinen führen den Leser nur auf eine Seite, sie liefern sie normalerweise nicht selbst aus. (Natürlich tut der Google Cache genau das, wenn man will, aber das wird wohl nicht oft genutzt, wenn der "richtige" Server verfügbar ist. Andererseits - vielleicht ist der Faktor bei der Wikipedia nicht zu vernachlässigen. ;o) )
Ciao, Eike
Danke für die Auskünfte. Insgesamt fände ich es schon interessant, wenn es mögliche wäre zu wissen, wievile User auf Wikipedia zugreifen und auf welche Artikel wie häufig z7ugregriffen wird.
Grüsse - IP X
Am Donnerstag, 22. September 2005 21:13 schrieb wikipedia user:
Danke für die Auskünfte. Insgesamt fände ich es schon interessant, wenn es mögliche wäre zu wissen, wievile User auf Wikipedia zugreifen und auf welche Artikel wie häufig z7ugregriffen wird.
Wir auch, wir auch. Wenn du ein paar Hundertausend (wenn's mal reicht) für Server zu viel hast, sag also bescheid...
Ciao, Eike
Am Donnerstag, 22. September 2005 21:13 schrieb wikipedia user:
Danke für die Auskünfte. Insgesamt fände ich es schon interessant, wenn es mögliche wäre zu wissen, wieviele User auf Wikipedia zugreifen und auf welche Artikel wie häufig zugregriffen wird.
Wir auch, wir auch. Wenn du ein paar Hundertausend (wenn's mal reicht) für Server zu viel hast, sag also bescheid...
Aber jede Forensoftware schaft das doch. Das müsste also kein Server Problem sein.
Grüsse - IP X
Hallo, Am Freitag, den 23.09.2005, 17:55 +0200 schrieb wikipedia.user@gmx.de:
Aber jede Forensoftware schaft das doch. Das müsste also kein Server Problem sein.
die WP (eigendlich alle WM-Projekte) hat zu Spitzenzeiten mehr als 3.500 Zugriffe pro SEKUNDE. Ich kenne kein Forum, dass solchen Belastungen ausgesetzt ist.
Mit freundlichen Grüssen DaB.
Hallo Wikipedianer,
wikipedia.user@gmx.de schrub:
Wir auch, wir auch. Wenn du ein paar Hundertausend (wenn's mal reicht) für Server zu viel hast, sag also bescheid...
Aber jede Forensoftware schaft das doch. Das müsste also kein Server Problem sein.
Du scheinst hier von falschen Voraussetzungen auszugehen. Die Wikipedia-Server spielen alleine von den Zugriffszahlen in einer Klasse, in der es IMHO keine Forensoftware gibt. Ich lasse mich gerne eines besseren belehren.
Tschuess, Tim.
... ich erinnere mich noch gut, als es (zu meinem Bedauern) abgeschaltet wurde, damals hiess es eindeutig, es geht darum die Performance-Bremse zu lösen, es ist alles noch da und wenn mans wollte, könnte mans (auf Kosten der Performance) jederzeit sehr schnell wieder einschalten, aber bei den vielen Wikipedia-Datenbankabfragen pro Sekunde (heute bereits weit, weit über 1.000) musste man damals als es noch viel weniger waren- halt nun einmal Prioritäten setzen, so schmerzhaft wie es sein mag. Ich hätte auch viel lieber zugeschaut, wie oft und wie schnell welcher Artikel bereits angesehen wurde ... ! Diese natürliche Neugierde sei uns allen erlaubt! Doch wir können noch immer auf (noch) bessere Zeiten hoffen, unser Projekt Wikipedia ist doch noch nicht einmal 5 Jahre alt! In dem Alter waren wir ja auch noch lange nicht so zum Allen fähig oder?
Ilja
--- Ursprüngliche Nachricht --- Von: "Tim 'avatar' Bartel" wikipedia@computerkultur.org An: "Mailingliste der deutschsprachigen Wikipedia" wikide-l@Wikipedia.org Betreff: Re: [Wikide-l] Warum wurde der Zugriffszähler auf die Artikel deaktiviert ? Datum: Fri, 23 Sep 2005 22:42:29 +0200 (CEST)
Hallo Wikipedianer,
wikipedia.user@gmx.de schrub:
Wir auch, wir auch. Wenn du ein paar Hundertausend (wenn's mal reicht) für Server zu viel hast, sag also bescheid...
Aber jede Forensoftware schaft das doch. Das müsste also kein Server Problem sein.
Du scheinst hier von falschen Voraussetzungen auszugehen. Die Wikipedia-Server spielen alleine von den Zugriffszahlen in einer Klasse, in der es IMHO keine Forensoftware gibt. Ich lasse mich gerne eines besseren belehren.
Tschuess, Tim.
WikiDE-l mailing list WikiDE-l@Wikipedia.org http://mail.wikipedia.org/mailman/listinfo/wikide-l
Hallo,
wikipedia user wikipedia.user@gmx.de schrieb am Thu, 22 Sep 2005 21:13:26 +0200:
Insgesamt fände ich es schon interessant, wenn es mögliche wäre zu wissen, wievile User auf Wikipedia zugreifen und auf welche Artikel wie häufig z7ugregriffen wird.
dem sind sich praktisch alle einig und es gibt verschiedenste Bestrebungen, bessere Daten zur Verfügung zu stellen. Auf der vorhin erwähnten Log-Seite, die bei mir noch immer nicht aufrufbar ist, gab es die Top 100 der meistbesuchen Seiten und theoretisch zum Download die Zugriffszahlen für alle Artikel (ich glaube aber, bei der deutschsprachigen Wikipedia gab es diese Liste nie). Die Sache ist einfach, dass die Wikipedia schon so groß ist, dass die Analyse und Bereitstellung dieser Daten unglaubliche Rechenkapazitäten benötigt, die derzeit nicht ausreichend vorhanden sind. Also einfach abwarten, ich glaube und hoffe, dass es _irgendwann_ wieder bessere Statistiken geben wird.
MfG Christian Thiele
Sozusagen als eine andere Art und Weise für die Versionsgeschichte. Interessant dürfte es bei dem Fall werden, wo in [[Molotow-Cocktail]] eine inzwischen gelöschte Version mit einer Mixanleitung drin war, man diese aber noch via Google Cache oder web.archive.org abrufen könnte(Habs noch nicht ausprobiert, müsste theoretisch aber gehen). Fraglich ist auch ob der Google Cache/web.archive.org auch die Artikel a la "Franz Kraus war ein bescheuerter Mathelehrer" speichert oder ob sie schnell genug gelöscht werden.
gn8 Marco
-----Original Message----- From: wikide-l-bounces@Wikipedia.org [mailto:wikide-l-bounces@Wikipedia.org]On Behalf Of EikeSauer@t-online.de Sent: Thursday, September 22, 2005 8:26 PM To: Mailingliste der deutschsprachigen Wikipedia Subject: Re: [Wikide-l] Warum wurde derZugriffszähler auf die Artikel deaktiviert?
Am Donnerstag, 22. September 2005 19:30 schrieb wikipedia.user@gmx.de:
Was ist mit Zugriffen, die über Suchmaschinen direkt zugreifen?
Suchmaschinen führen den Leser nur auf eine Seite, sie liefern sie normalerweise nicht selbst aus. (Natürlich tut der Google Cache genau das, wenn man will, aber das wird wohl nicht oft genutzt, wenn der "richtige" Server verfügbar ist. Andererseits - vielleicht ist der Faktor bei der Wikipedia nicht zu vernachlässigen. ;o) )
Ciao, Eike