Mathias Schindler wrote:
Mit den Zahlen selbst kann man noch mehr anstellen.
Gestern fragte jemand am [[sv:WP:BB]] (village pump) welche Artikel in sv.wp haben <ref> aber kein <references/>. Es war einfach genug die 298 Seiten zu finden. Aber dann habe ich diese nach Besuchsfrequenz (Anzahl Besuche in der vorigen Woche) geordnet und aufgelistet, von Metallica (3146 Besuche) bis Ulbrichtdoktrin (2 Besuche).
http://sv.wikipedia.org/wiki/WP:BB#Referenss.C3.B6kning
Ich meine wir hätten besser ein Toolserver Script entwickeln (dort habe ich kein Account), um diese Besuchstatistik als Top Listen oder Grafen zu zeigen. Aber ausserdem brauchen wir einen Webbauftritt für die Sortierung von solchen Listen. Die Liste kann dann als HTML-Formular eingegeben werden, oder als eine Kategoriename, oder als eine Seitenname, von welcher man alle verlinkte Seiten einbringt.
Aber jetzt strömen Loggdateien hierein mit 100+ Megabytes *pro Stunde* (25 MB/Stunde komprimiert). Kann der Toolserver diese überhaupt speichern und in MySQL suchbar machen? Oder müssen wir zuerst tägliche / wöchentliche Summierungen machen?
2007121917 172 2007121918 170 2007121919 146 2007121920 112 2007121921 86 2007121922 69 2007121923 65 2007122000 49
Hier ist die Variation (in Anzahl Besuche) nicht nur von Popularität abhängig, sondern auch von der Uhrzeit. Für Vergleiche eignet sich das (relative) Ranking besser als die (absolute) Anzahl von Besuchen. Etwa: "sort -nr|cat -n|grep"
Tag Ranking Besuche Artikel 20071217 86922 41 Andrea_Kiewel 20071218 89398 38 Andrea_Kiewel 20071219 368 1641 Andrea_Kiewel 20071220 45 4843 Andrea_Kiewel
Tag Stunde Ranking Besuche Artikel Ranking-Veränderung 20071219-0700 - 0 Andrea_Kiewel 20071219-0800 86145 2 Andrea_Kiewel 20071219-0900 281150 1 Andrea_Kiewel 20071219-1000 315630 1 Andrea_Kiewel 20071219-1100 84692 3 Andrea_Kiewel × 3,72 20071219-1200 8037 18 Andrea_Kiewel ×10,54 20071219-1300 1527 51 Andrea_Kiewel × 5,26 20071219-1400 89 253 Andrea_Kiewel ×17,16 20071219-1500 98 246 Andrea_Kiewel × 0,90 20071219-1600 110 233 Andrea_Kiewel × 0,89 20071219-1700 178 172 Andrea_Kiewel × 0,61 20071219-1800 156 170 Andrea_Kiewel × 1,14 20071219-1900 244 146 Andrea_Kiewel × 0,63 20071219-2000 388 112 Andrea_Kiewel × 0,62 20071219-2100 571 86 Andrea_Kiewel × 0,68 20071219-2200 595 69 Andrea_Kiewel × 0,96 20071219-2300 380 65 Andrea_Kiewel × 1,56
Als Leute gehen zu Bett (Uhrzeit 23) fallen die Anzahl von Besuchen von 69 bis 65, aber das Ranking wird gesteigert (×1,56). Um das Ranking bei 595 zu behalten, hätten die Besuche noch sterker fallen müssen. Leute die so spät Wikipedia lesen, sind vielleicht die die erst jetzt nach Hause gekommen sind und die Nachrichten nicht gehört haben?