[Wikide-l] Visualisierung der Inhaltsstruktur

Christian Thiele apper at apper.de
Mi Jan 20 01:12:31 UTC 2010


Hi,

Am 19.01.2010, 23:41 Uhr, schrieb Bjoern Hoehrmann <derhoermi at gmx.net>:

> Um mir selbst ein Bild zu machen habe ich die Kategoriestruktur, Seiten-
> daten und Zugriffsdaten von kurz vor Weihnachten gesammelt und ausge-
> wertet und als interaktive "Treemap" (Grössenverhältnisse werden durch
> verschieden grosse und verschieden gefärbte verschachtelte Blöcke dar-
> gestellt) ins Netz gestellt.

sehr spannend. Wir haben zwar weniger Biografien zu Frauen, diese werden  
im Mittel aber häufiger gelesen. Auch bei "Person nach Tätigkeit" ergeben  
sich spannende Ergebnisse... so werden wenig überraschend Artikel über  
Models, Prostituierte und Zuhälter sehr oft gelesen, wohingegen ein  
Archivar im Durchschnitt nur 20% der Zugriffe eines Moderators erhält ;).

> Einige nützliche Daten fallen allerdings auch
> auf, so haben wir zum Beispiel bald 328 000 Personen, aber nur 300 000
> Personen nach Geschlecht, also fehlt bei 28 000 Personen wohl diese Zu-
> ordnung.

ja, sehr spannend. Da ich mich aber recht viel mit Biografien beschäftige,  
vermute ich da irgendwelche anderen Effekte - Biografien ohne eine  
Mann/Frau-Kategorie kommen doch zu selten vor. Dein Script zeigt auch  
insgesamt 1.063.624 Artikel an, obwohl die Wikipedia zu der Zeit, als du  
die Zugriffe erfasst hast, noch gar keine Million Artikel hatte.

> In jedem Fall kann es recht kurzweilig sein da durch die Ge-
> gend zu klicken, in dem Sinne, viel Spass.

Yep! Danke dafür.

Grüße,
Christian Thiele / APPER