Es sind nur noch 548 Seiten, die mit A anfangen und noch nicht kategorisiert sind. Ich hatte in Erinnerung, daß die Zahl mal größer war.
Nicht, daß die generelle Konfusion zu Kategorisierungen weg sei, aber in meinen Augen ist das erstmal ein schöner Erfolg.
-----Ursprüngliche Nachricht----- Von: wikide-l-bounces@Wikipedia.org [mailto:wikide-l- bounces@Wikipedia.org] Im Auftrag von Mathias Schindler Gesendet: Dienstag, 30. November 2004 14:21 An: Mailingliste der deutschsprachigen Wikipedia Betreff: [Wikide-l] Kategorisierungsorgie
Es sind nur noch 548 Seiten, die mit A anfangen und noch nicht kategorisiert sind. Ich hatte in Erinnerung, daß die Zahl mal größer war.
Nicht, daß die generelle Konfusion zu Kategorisierungen weg sei, aber in meinen Augen ist das erstmal ein schöner Erfolg.
Wie sieht es den in der gesamten Wikipedia aus? Haben wir schon 60% kategorisiert oder sind wir noch nicht so weit?
Bei den Personen sind wir auf jeden Fall schon ziemlich weit. Von 25181 Personen haben wir schon kategorisiert. 21729 Männer und 3452 Frauen + 2 in der [[Kategorie:Intersexueller]]. In den nächsten Tagen werden noch mal so zwischen 2000 und 3000 hinzukommen, die aus der Personenliste der Wikipedia-CD ermittelt wurden und bisher aber noch keine Kategorie abbekommen haben.
Wäre interessant, wie die Verteilung der Artikel in den Kategorien + Unterkategorien aussieht. Also sind 25% der Artikel in der Oberkategorie Informatik einsortiert?
Stefan
Stefan Kühn kuehns@uni-trier.de schrieb am Tue, 30 Nov 2004 15:11:45 +0100:
Wie sieht es den in der gesamten Wikipedia aus? Haben wir schon 60% kategorisiert oder sind wir noch nicht so weit?
Beim Datenbankdump vom 26.11. kommen wir auf eine Quote von 71%.
Wäre interessant, wie die Verteilung der Artikel in den Kategorien + Unterkategorien aussieht. Also sind 25% der Artikel in der Oberkategorie Informatik einsortiert?
Das versteh ich nicht... was genau meinst du?
MfG Christian Thiele (Benutzer:APPER)
Stefan Kühn kuehns@uni-trier.de schrieb am Tue, 30 Nov 2004 15:11:45 +0100:
Wie sieht es den in der gesamten Wikipedia aus? Haben wir schon 60% kategorisiert oder sind wir noch nicht so weit?
Beim Datenbankdump vom 26.11. kommen wir auf eine Quote von 71%.
Wäre interessant, wie die Verteilung der Artikel in den Kategorien + Unterkategorien aussieht. Also sind 25% der Artikel in der Oberkategorie Informatik einsortiert?
Das versteh ich nicht... was genau meinst du?
MfG Christian Thiele (Benutzer:APPER)
Bei heute 171794 Artikeln wären 71% schon 121973 kategorisierte Artikel! Nicht schlecht. Warten also noch 49820 auf ihre Kategorisierung. Ich freue mich schon auf den Tag, an dem nur noch neue Artikel bei der Spezialseite der nicht kategorisierten Artikel auftauchen.
Mit der Verteilung meine ich folgendes. 25181 kategorisierte Personenartikel von allen 121973 kategorisierten Artikeln bedeutet einen Anteil von 20%. Man kann also vermuten, dass zu 20 Prozent die gesamte Wikipedia mit Personenbiografien gefüllt ist. Jetzt würde mich interessieren wie hoch der Anteil der Informatikartikel oder der Juraartikel oder der Ortsartikel an der gesamten Wikipedia ist. Dazu müsste man z.B. die Kategorie:Informatik und alle ihre Unterkategorien mal auszählen und könnte so eine auf den Gesamtanteil schließen.
Stefan
Stefan Kühn schrieb:
Jetzt würde mich interessieren wie hoch der Anteil der Informatikartikel oder der Juraartikel oder der Ortsartikel an der gesamten Wikipedia ist. Dazu müsste man z.B. die Kategorie:Informatik und alle ihre Unterkategorien mal auszählen und könnte so eine auf den Gesamtanteil schließen.
Ja, das wäre sehr interessant. Nach solchen Zahlen werde ich häufig gefragt, und auch in Vorträgen und Artikeln würden sie sich gut machen.
Auch über die Entwicklung der Wikipedia ließe sich mit diesen Zahlen interessantes herausfinden, sofern das Kategoriensystem sich einigermaßen stabilisiert hat. Uli zeigte mir Anfang November ein paar Statistiken zu dieser Fragestellung, die er anhand von Stichproben erstellt hatte.
Kurt