Hallo,
wie kann man die - früher ja jeder Seite mitgelieferte - Anzahl der Page Views eines Artikels ermitteln?
Ich möchte ungern viel Arbeit in das regelmäßige Update von Artikeln reinstecken, wenn da eh niemand vorbeiguckt. -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- Michael Brückner <media_lib> ______________________________________________________________________________ Erdbeben im Iran: Zehntausende Kinder brauchen Hilfe. UNICEF hilft den Kindern - helfen Sie mit! https://www.unicef.de/spe/spe_03.php
On Tue, 10 Feb 2004 08:57:48 +0100, =?iso-8859-1?Q? "Michael=20Br=FCckner" ?= wrote:
Hallo,
wie kann man die - früher ja jeder Seite mitgelieferte - Anzahl der Page Views eines Artikels ermitteln?
Die Logdateien werden momentan nicht ausgewertet (auf Larousse fehlt Festplattenplatz dafür). Gestern war auf de einiges los, etwa 19 Anfragen pro Sekunde von insgesamt 97. Die neuen Server werden momentan getestet, sobald Wikipedia umgezogen ist werden wir die Logs auspacken und durch Webalizer schieben. Eine alternative wäre der Download der Logs, bei etwa 100Mb pro Tag ist das aber nur begrenzt praktikabel.
Gabriel Wicke wrote:
werden wir die Logs auspacken und durch Webalizer schieben. Eine alternative wäre der Download der Logs, bei etwa 100Mb pro Tag ist das aber nur begrenzt praktikabel.
Naja, es müsste ja nicht das ganze NCSA log format sein, sondern einfach nur die aufgerufene url und timestamp, letzteres im zweifelsfall noch nicht einmal zwingend. $ gawk -F'"' '{ print $2 }' dateiname >> counter.txt gebzip2d sollten das nicht mehr 100MB sein. Lokal müsste man dann nur noch grep auf den Artikelnamen | wc -l machen oder so. Grüße Mathias
On Tue, 10 Feb 2004 12:39:08 +0100, Mathias Schindler wrote:
Gabriel Wicke wrote:
werden wir die Logs auspacken und durch Webalizer schieben. Eine alternative wäre der Download der Logs, bei etwa 100Mb pro Tag ist das aber nur begrenzt praktikabel.
Naja, es müsste ja nicht das ganze NCSA log format sein, sondern einfach nur die aufgerufene url und timestamp, letzteres im zweifelsfall noch nicht einmal zwingend.
Format ist momentan dies: 213.54.181.71 - - [10/Feb/2004:12:01:06 +0000] "GET http://de.wikipedia.org/wiki/Tschechien HTTP/1.0" 200 0 TCP_MEM_HIT:NONE
Da kann man nicht mehr so fürchterlich viel einsparen.
Dies sind die logs der letzten Tage: /var/export/larousse/logs> ls -lh total 1.1G -rw-r--r-- 1 gwicke wikidev 483M 2004-02-10 07:15 2000207.tar.bz2 -rw-r--r-- 1 gwicke wikidev 103M 2004-02-07 09:55 20040207_2.tar.gz -rw-r--r-- 1 gwicke wikidev 114M 2004-02-08 10:11 20040208_0609.tar.gz -rw-r--r-- 1 gwicke wikidev 77M 2004-02-08 17:23 20040209_0120.tar.gz -rw-r--r-- 1 gwicke wikidev 237M 2004-02-09 04:53 20040209_1245.tar.gz -rw-r--r-- 1 gwicke wikidev 58M 2004-02-09 15:26 20040209_2233.tar.bz2 -rw-r--r-- 1 gwicke wikidev 53M 2004-02-10 06:13 20040210_1304.tar.bz2
Grüße
"Michael Brückner" media_lib@web.de writes:
Ich möchte ungern viel Arbeit in das regelmäßige Update von Artikeln reinstecken, wenn da eh niemand vorbeiguckt.
Was ist denn das für eine Einstellung? ;) An mittelalterlichen Kathedralen gibt es fein ausgearbeitete Stellen, die nie ein Mensch wirklich sehen konnte. Die Werke wurden quasi für Gott gemacht, und deshalb sehr gut (es gab "Rückseiten", die nicht ausgearbeitet wurden - dsa will ich nicht verschweigen).
Ich arbeite oft nur an einem Artikel oder an Artikelserien, weil es mir Freude macht - ob heute oder morgen diese Sachen liest, interessiert mich nur nachrangig. Später wird die Arbeit aber gewiß gewürdigt werden.
Überhaupt können Logs sehr trügerisch sein - ob diese Seite wirklich gelesen oder auch nur angeschaut wurde, kann man einem einzelen Log-Eintrag nicht entnehmen.
On Tue, Feb 10, 2004 at 08:57:48AM +0100, =?iso-8859-1?Q? Michael=20Br=FCckner ?= wrote:
Hallo,
wie kann man die - früher ja jeder Seite mitgelieferte - Anzahl der Page Views eines Artikels ermitteln?
Ich möchte ungern viel Arbeit in das regelmäßige Update von Artikeln reinstecken, wenn da eh niemand vorbeiguckt.
Zusätzlich zu keichwa noch: Die Artikel werden mit einer gewissen Verzögerung gelesen. Je mehr du schreibst desto schneller spricht es sich rum dass es den Artikel gibt und dass er gut ist.
Der Artikel zu Salpeterkrieg/Pazifische Krieg den ich mal beschrieben hatte, ist inzwischen #1 bei der Google-Abfrage. Das der Artikel nur geschichtlich interessierte Südamerika Fans interessiert (ich bin übrigens keiner), war mir auch egal. Die Arbeit hat sich gelohnt
ciao, tom