Hallo,
Ich bin endlich dazu gekommen, den schon ueber einen Monat alten XML-dump zu traktieren, um Personendaten und PND-Nummern zu extrahieren. Die Daten sind verfügbar unter http://wdw.sieheauch.de/
Die deutschsprachige Wikipedia vom 13./14. Juli enthielt 262809 Artikel, von denen 47785 mit Personendaten versehen sind. Die Schätzung von 18% biographischer Artikel ist konservativ, da nicht alle Personenartikel Personendaten enthalten. 13657 Artikel, also knapp 29% der Personenartikel haben eine PND-Nummern (allerdings bisher nicht auf Fehler geprüft).
Die nächsten Schritte sind ein Nachprüfen der PND-Nummern. Es gibt bereits mehrere Anfragen von anderen Institutionen, die neben der DDB gerne über die PND auf ihre Datenbanken verlinkt werden würden. Patrick, Christian und ich arbeiten an einer Methode, dies (ähnlich wie bei den ISBN-Nummer) zu ermöglichen - allerdings sollte es etwas intelligenter als bei den ISBN-Nummern oder Geokoordinaten sein, wo man leider zunächst eine viel zu riesige Liste von Links bekommt.
Soweit erstmal von mir, Jakob
P.S: Falls noch jemand mit guten Englisch-Kenntnissen mein Paper korrekturlesen möchte, würde ich mich sehr freuen: http://en.wikibooks.org/wiki/Wikimania05/JV2
Hallo,
gib es eine Seite Wikipedia Fachchinesisch wo Begriffe wie "PND" erklärt werden?
Grüsse - IP X
Hallo,
Ich bin endlich dazu gekommen, den schon ueber einen Monat alten XML-dump zu traktieren, um Personendaten und PND-Nummern zu extrahieren. Die Daten sind verfügbar unter http://wdw.sieheauch.de/
Die deutschsprachige Wikipedia vom 13./14. Juli enthielt 262809 Artikel, von denen 47785 mit Personendaten versehen sind. Die Schätzung von 18% biographischer Artikel ist konservativ, da nicht alle Personenartikel Personendaten enthalten. 13657 Artikel, also knapp 29% der Personenartikel haben eine PND-Nummern (allerdings bisher nicht auf Fehler geprüft).
Die nächsten Schritte sind ein Nachprüfen der PND-Nummern. Es gibt bereits mehrere Anfragen von anderen Institutionen, die neben der DDB gerne über die PND auf ihre Datenbanken verlinkt werden würden. Patrick, Christian und ich arbeiten an einer Methode, dies (ähnlich wie bei den ISBN-Nummer) zu ermöglichen - allerdings sollte es etwas intelligenter als bei den ISBN-Nummern oder Geokoordinaten sein, wo man leider zunächst eine viel zu riesige Liste von Links bekommt.
Soweit erstmal von mir, Jakob
P.S: Falls noch jemand mit guten Englisch-Kenntnissen mein Paper korrekturlesen möchte, würde ich mich sehr freuen: http://en.wikibooks.org/wiki/Wikimania05/JV2
WikiDE-l mailing list WikiDE-l@Wikipedia.org http://mail.wikipedia.org/mailman/listinfo/wikide-l
Jakob Voss wrote:
Die deutschsprachige Wikipedia vom 13./14. Juli enthielt 262809 Artikel, von denen 47785 mit Personendaten versehen sind.
Wirklich? Wenn ich [[de:Vorlage:Personendaten]] besuche und "Links auf diese Seite" klicke, finde ich nur 42147 Links. Wie soll man dieser Unterschied von 5638 verstehen?
http://de.wikipedia.org/w/index.php?title=Spezial:Whatlinkshere&limit=10...
Lars Aronsson schrieb:
Die deutschsprachige Wikipedia vom 13./14. Juli enthielt 262809 Artikel, von denen 47785 mit Personendaten versehen sind.
Wirklich? Wenn ich [[de:Vorlage:Personendaten]] besuche und "Links auf diese Seite" klicke, finde ich nur 42147 Links. Wie soll man dieser Unterschied von 5638 verstehen?
http://de.wikipedia.org/w/index.php?title=Spezial:Whatlinkshere&limit=10...
Da muss wohl irgendwo ein Fehler vorliegen. Ich kann nur sagen, wieviele Arikel im Dump eine Personendaten-Vorlage haben. Ich vermute, dass die Links-Tabelle nicht immer korrekt ist, der Fehler kann aber auch woanders liegen. Übrigens schäze ich, dass 10% der PND-Nummern falsch sind.
Gruß, Jakob