"It will be interesting to see what the 21st century holds for Britannica. As Bob McHenry admits, "The dirty little secret of the encyclopedia industry is that we don't know whether or not people read what we publish." "
http://www.wired.com/wired/archive/3.08/brittanica.html?pg=4&topic=
Es ist schon gemein, jemandem ein 9 Jahre altes Zitat an den Kopf zu werfen.
In meinen Augen war es jedoch schon in dem Augenblick falsch, als die Enzyklopädisten zu Verlegern wurden. Der Luxus, nicht danach zu fragen oder es schlichweg zu ignorieren, hat nichts mit der Industrie zu tun, auf die er verweist. Die Entscheidung, sich im konkreten Einzelfall gegen einen Mehrheitswunsch zu richten, ist am Ende auch ein Verkaufsargument.
Vielleicht wären einige Enzyklopädisten lieber Schuster geworden, wenn sie http://de.wikipedia.org/wiki/Wikipedia:Seitenstatistik/Top_1000 gelesen hätten, insbesondere 6, 8, 14, 33, 38,
Mathias
On Thu, Dec 23, 2004 at 01:57:32PM +0100, Mathias Schindler wrote:
Vielleicht wären einige Enzyklopädisten lieber Schuster geworden, wenn sie http://de.wikipedia.org/wiki/Wikipedia:Seitenstatistik/Top_1000 gelesen hätten, insbesondere 6, 8, 14, 33, 38,
Also das mit Spanien überrascht mich wirklich sehr ;-)
Ich denke mal die wissen sehr genau was die Leute lesen, mesbar am Echo den z.B. Fehler oder veraltete Daten in einer Enzyklopädie erzeugen. Oder was dachtet ihr warum die Wikipedia so viele Fehler enthält ;-)
ciao, tom
Vielleicht wären einige Enzyklopädisten lieber Schuster geworden, wenn sie http://de.wikipedia.org/wiki/Wikipedia:Seitenstatistik/Top_1000 gelesen hätten, insbesondere 6, 8, 14, 33, 38,
Die Seitenstatistik ist wenig aussagefähig - sie zeigt nicht nur Artikel, die viel gelesen, sondern vor allem solche, die viel bearbeitet werden (und dann ist die Peinlichkeit eher für die Autoren der Wikipedia, als für die Leser richtiger Enzyklopädien gegeben). Natürlich sind die Sex-und Co-Artikel oben mit dabei - an denen wird am häufigsten vandalisiert, sie stehen auf den meisten Beobachtungslisten und werden am häufigsten kontrolliert. Damit rutschen sie in den Zähllisten nach oben.
Die Seitenstatistik kann nur sehr eingeschränkt herangezogen werden, um *Lesezugriffe* zu beurteilen. Beispielsweise ist der Artikel [[Saturn (Planet)]] im Juli-August mit viel neuem (und offenbar brauchbaren, weil heute noch vorhandenem) Text erweitert worden:
04-04: 308 04-05: 674 04-06: 559 04-07: 1639 04-08: 1338 04-09: 661
(Jeweils Periode und Zeichen aus dieser Periode im heutigen Artikel). Die Seitenstatistik spiegelt das wieder: 23,73 21,00 25,76 45,77 45,54 26,28. Das nur als Einzelfallbeispiel, meine Analysesoftware arbeitet derzeit nur mit Artikeln, die vor 2003 vorhanden waren, sonst hätte ich mir noch ein paar andere vorgenommen - aber nach allem, was ich mittlerweile von dem System-Verhalten der Wikipedia weiß, würde ich das Ergebnis schon generalisieren wollen: Die Präferenzen der *Autoren* der Wikipedia verschmutzt die Seiten-Aufrufstatistik so, dass diese die Präferenzen der *Leser* nicht wiedergeben kann.
Schöne Weihnachten Uli
Ulrich Fuchs wrote:
Die Präferenzen der *Autoren* der Wikipedia verschmutzt die Seiten-Aufrufstatistik so, dass diese die Präferenzen der *Leser* nicht wiedergeben kann.
Zustimmung.
Ob eine Auswertung der Suchbegriffe brauchbarer wäre?
Mathias
Ulrich Fuchs wrote:
Die Präferenzen der *Autoren* der Wikipedia verschmutzt die Seiten-Aufrufstatistik so, dass diese die Präferenzen der *Leser* nicht wiedergeben kann.
Zustimmung.
Ob eine Auswertung der Suchbegriffe brauchbarer wäre?
Mathias
IMHO nein. Die meisten Seiten rufe ich durch eingabe der URL auf oder durch Links. Ich denke das geht vielen so.
Gruß,
Leon
Mathias Schindler schrieb:
Ulrich Fuchs wrote:
Die Präferenzen der *Autoren* der Wikipedia verschmutzt die Seiten-Aufrufstatistik so, dass diese die Präferenzen der *Leser* nicht wiedergeben kann.
Zustimmung.
Ob eine Auswertung der Suchbegriffe brauchbarer wäre?
Vielleicht - doch um etwas auswerten zu können, benötigt man erst einmal entsprechende Statistiken ( http://wikimedia.org/stats/de.wikipedia.org/ ) ;-). Die werden aber seit Oktober nicht mehr erhoben :(, weshalb ich die diskutierte Seite schon länger nicht mehr aktualisiert habe.
mfg Henning
Ulrich:
Natürlich sind die Sex-und Co-Artikel oben mit dabei - an denen wird am häufigsten vandalisiert, sie stehen auf den meisten Beobachtungslisten und werden am häufigsten kontrolliert. Damit rutschen sie in den Zähllisten nach oben.
Einzelne der in die Kategorie "Sexualität" oder Unterkategorien davon eingeordneten Artikel stehen oben auf der Liste, aber insgesamt haben sie einen geringen Anteil an den Leseaufrufen (langsam steigend von 0.67% im Februar bis 1.12% im Oktober). Und dabei sind auch noch alle Artikel aus dem Bereich "Feminismus" mit eingerechnet.
Zum Vergleich die Werte für einige andere Kategorien (incl. Unterkategorien) im Oktober:
Physik: 2.4% Mathematik: 4.1% Informatik: 7.9% Geschichte: 12.2%
Die Seitenstatistik kann nur sehr eingeschränkt herangezogen werden, um *Lesezugriffe* zu beurteilen.
Warum? Die in der Seitenstatistik einzeln aufgeführten Seitenabrufe beziehen sich ausschließlich auf das Lesen der Artikel. Alle anderen Aktionen wie das Bearbeiten oder Ansehen der Versionsgeschichte mit Diffs etc. zählen nicht dazu.
Beispielsweise ist der Artikel [[Saturn (Planet)]] im Juli-August mit viel neuem (und offenbar brauchbaren, weil heute noch vorhandenem) Text erweitert worden:
04-04: 308 04-05: 674 04-06: 559 04-07: 1639 04-08: 1338 04-09: 661
(Jeweils Periode und Zeichen aus dieser Periode im heutigen Artikel). Die Seitenstatistik spiegelt das wieder: 23,73 21,00 25,76 45,77 45,54 26,28.
Vielleicht war im Sommer gerade woanders etwas über den Saturn und die Sonde, die man dahin geschickt hat, zu lesen. Sowas zieht Leser ebenso wie Autoren an.
Die Präferenzen der *Autoren* der Wikipedia verschmutzt die Seiten-Aufrufstatistik so, dass diese die Präferenzen der *Leser* nicht wiedergeben kann.
Nein (s.o.). Außerdem sind einige Wikipedia-Leser eben auch Autoren, warum sollte man die überhaupt unberücksichtigt lassen?
El
elwp@gmx.de skribis:
Ulrich:
Die Seitenstatistik kann nur sehr eingeschränkt herangezogen werden, um *Lesezugriffe* zu beurteilen.
Warum? Die in der Seitenstatistik einzeln aufgeführten Seitenabrufe beziehen sich ausschließlich auf das Lesen der Artikel. Alle anderen Aktionen wie das Bearbeiten oder Ansehen der Versionsgeschichte mit Diffs etc. zählen nicht dazu.
Nach jeder Bearbeitung wird die Seite neu angezeigt, und vorher hat man sie im allgemeinen auch angezeigt.
Außerdem taucht sie dann in Beobachtungslisten und Letzten Änderungen auf, wodurch weitere Leute sich die Seite ansehen.
Alles nur eine Folge von "Bearbeiten", kein "Ich interessiere mich für das Thema und will mal nachsehen, was hier dazu steht".
Interessant wäre es, die Lesestatistik getrennt nach angemeldeten Benutzern und Nichtangemeldeten zu haben.
Paul
Paul:
Nach jeder Bearbeitung wird die Seite neu angezeigt, und vorher hat man sie im allgemeinen auch angezeigt.
Gut, das wären 2 Zugriffe pro Bearbeitung.
Außerdem taucht sie dann in Beobachtungslisten und Letzten Änderungen auf, wodurch weitere Leute sich die Seite ansehen.
Auf diesem Weg sehe ich mir praktisch nie die Seiten direkt an, sondern meistens über die Diff-/Hist-Links, und das zählt nicht als Lesezugiff.
Alles nur eine Folge von "Bearbeiten", kein "Ich interessiere mich für das Thema und will mal nachsehen, was hier dazu steht".
Ich rechne es mal am Beispiel Saturn vor: Im Juli und August gab es insgesamt 36 Bearbeitungen. Im November hatten 9 Benutzer den Artikel auf ihrer Beobachtungsliste. Ich schätze, dass es im Juli/August nicht mehr waren und dass höchstens 6 von ihnen ihre Beobachtungsliste auch aktiv benutzen und die meisten davon wiederum die Diff-/Hist-Links nehmen statt den Artikel direkt aufzurufen. Dann blieben wohl höchstens 2 zusätzliche Aufrufe pro Bearbeitung, vor allem wenn man auch noch bedenkt, dass viele Bearbeitungen zeitlich eng beieinander liegen und über die Beobachtungsliste kaum einzeln wahrgenommen werden. Über die Liste der letzten Änderungen werden die Artikel vermutlich auch nicht mehr als 6 mal pro Bearbeitung kontrolliert (sonst würde nicht so viel Vandalismus unbemerkt bleiben). Ich nehme auch hier maximal 2 direkte Seitenaufrufe pro Bearbeitung an.
Dann komme ich insgesamt auf 6 direkte Seitenaufrufe pro Bearbeitung. Das wären bei 0.58 Bearbeitungen pro Tag etwa 3.5 Aufrufe pro Tag. Das muss man jetzt vergleichen mit den ca. 45 Seitenaufrufen pro Tag, die man aus den Serverstatistiken berechnen kann. Und da kann man wohl kaum davon sprechen, dass die Autoren diese Statistik großartig "verschmutzen".
Interessant wäre es, die Lesestatistik getrennt nach angemeldeten Benutzern und Nichtangemeldeten zu haben.
Das geben die Webalizer-Statistiken leider nicht her.
El
Ich:
Einzelne der in die Kategorie "Sexualität" oder Unterkategorien davon eingeordneten Artikel stehen oben auf der Liste, aber insgesamt haben sie einen geringen Anteil an den Leseaufrufen (langsam steigend von 0.67% im Februar bis 1.12% im Oktober). Und dabei sind auch noch alle Artikel aus dem Bereich "Feminismus" mit eingerechnet.
Zum Vergleich die Werte für einige andere Kategorien (incl. Unterkategorien) im Oktober:
Physik: 2.4% Mathematik: 4.1% Informatik: 7.9% Geschichte: 12.2%
Bei der Berechnung habe ich einen Fehler gemacht und außerdem die Werte nicht auf alle kategorisierten Artikel sondern auf alle aufgerufenen Artikel bezogen. Eine vollständige Tabelle für alle Hauptkategorien, die mit einer korrigierten Programmversion berechnet wurde, befindet sich jetzt unter
http://de.wikipedia.org/wiki/Wikipedia:Wikipedistik/Leserinteressen
Auch nach den neuen Werten hält sich das Interesse an Sex-Artikeln im Vergleich zu anderen Themen in Grenzen.
El
On Thursday 23 December 2004 16:27, Ulrich Fuchs wrote:
Vielleicht wären einige Enzyklopädisten lieber Schuster geworden, wenn sie http://de.wikipedia.org/wiki/Wikipedia:Seitenstatistik/Top_1000 gelesen hätten, insbesondere 6, 8, 14, 33, 38,
Die Seitenstatistik ist wenig aussagefähig - sie zeigt nicht nur Artikel, die viel gelesen, sondern vor allem solche, die viel bearbeitet werden (und dann ist die Peinlichkeit eher für die Autoren der Wikipedia, als für die Leser richtiger Enzyklopädien gegeben). Natürlich sind die Sex-und Co-Artikel oben mit dabei - an denen wird am häufigsten vandalisiert, sie stehen auf den meisten Beobachtungslisten und werden am häufigsten kontrolliert. Damit rutschen sie in den Zähllisten nach oben.
Die Nr. 6 wurde seit Anfang November 50 mal editiert, hat aber im gleichen Zeitraum ca. 330 Hits pro Tag(!) generiert. Ich weiß jetzt nicht, auf wieviel Beobachtungslisten die Artikel stehen, ich kann mir aber nur schwerlich vorstellen, das dadurch eine nennenswerte Anzahl an Hits/Tag zu Stande kommt. Die Statistik wird sicherlich dadurch verschmutzt, aber nennenswert?
Von den 50 Änderungen ist ein Teil so dicht hintereinander ausgeführt worden, dass es wohl niemand auf seiner Beobachtungsliste als zwei getrennte Ereignisse wahrgenommen hat und nur einmal den Artikel/Versionsgeschichte überprüft hat. Bei ca. 32 "echten" edits würde dies bedeuten, dass ungefähr 62 Benutzer den Artikel auf ihrer Beobachtungsliste haben müssten und ihn nach jeder "echten" Änderung auch kontrollieren, damit der Einfluss auf die Gesamtanzahl nennenswert ist (>10%).
Wenn man die Anfragen auf den Artikel nach der Zeit aufschlüsseln könnte, dann könnte man sicherlich mehr darüber sagen, wie groß der Einfluss der angemeldeten Benutzer wirklich ist.
Viele Grüße, Marco