Hallo,
Ich bin endlich dazu gekommen, den schon ueber einen Monat alten XML-dump zu traktieren, um Personendaten und PND-Nummern zu extrahieren. Die Daten sind verfügbar unter http://wdw.sieheauch.de/
Die deutschsprachige Wikipedia vom 13./14. Juli enthielt 262809 Artikel, von denen 47785 mit Personendaten versehen sind. Die Schätzung von 18% biographischer Artikel ist konservativ, da nicht alle Personenartikel Personendaten enthalten. 13657 Artikel, also knapp 29% der Personenartikel haben eine PND-Nummern (allerdings bisher nicht auf Fehler geprüft).
Die nächsten Schritte sind ein Nachprüfen der PND-Nummern. Es gibt bereits mehrere Anfragen von anderen Institutionen, die neben der DDB gerne über die PND auf ihre Datenbanken verlinkt werden würden. Patrick, Christian und ich arbeiten an einer Methode, dies (ähnlich wie bei den ISBN-Nummer) zu ermöglichen - allerdings sollte es etwas intelligenter als bei den ISBN-Nummern oder Geokoordinaten sein, wo man leider zunächst eine viel zu riesige Liste von Links bekommt.
Soweit erstmal von mir, Jakob
P.S: Falls noch jemand mit guten Englisch-Kenntnissen mein Paper korrekturlesen möchte, würde ich mich sehr freuen: http://en.wikibooks.org/wiki/Wikimania05/JV2