http://www.dradio.de/dlf/sendungen/forschak/863295/
Wir nehmen mal einen ganz kleinen Ausschnitt davon und nehmen ein
Modell von Weltwissen, wie es der Wikipedia zugrunde liegt, da gibt es
im Prinzip einen technischen Abzug von der Wikipedia, die sich um
reines Faktenwissen kümmert, und an die klinken wir das an, technisch.
"Contentus" bekommt also nicht das komplette Lexikon eingetrichtert,
sondern nur das, was man bei einem Wikipedia-Artikel ganz unten
findet, die lexikalische Kategorisierung. Beim Eintrag "Hermann Hesse"
also zum Beispiel: "Autor, Person, Mann". So banal eine solche relativ
grobe Einordnung auf den ersten Blick erscheinen mag: Sie ermöglicht
erst, dass ein semantisches Konzept im Gegensatz zur Volltextsuche mit
Mehrdeutigkeiten, mit den so genannten Ambiguitäten umgehen kann:
---
Damit wird unsere Debatte, ob es eine Kategorie "Düsseldorfer" geben
darf, natürlich auch ein wenig semantisch angereichert. Spannend
hierbei ist, dass man eigentlich auch die eigenen im Haus befindlichen
Normdaten hätte bemühen können, beispielsweise SWD
(
http://de.wikipedia.org/wiki/Schlagwortnormdatei) oder PND. Der
PND-Eintrag zu Hesse sieht dann so aus:
http://dispatch.opac.d-nb.de/DB=4.1/SET=4/TTL=1/PRS=PP%7F/PPN?PPN=11855042X
Person kommt dann PND heraus, Mann durch die Berufe. In 042B des
PICA-Datensatzes steht dann was zur Nationalität und Verwandtschaften
sind auch enthalten
(
http://dispatch.opac.d-nb.de/DB=4.1/SET=4/TTL=1/PRS=PP%7F/PPN?PPN=11855042X).
Offenbar wollte man aber bei Contentus modern sein.
Mehr zu Contentus und wie es uns in Zukunft alle (dank
Wikipedia-Weltwissen) beglücken wird unter
http://theseus-programm.de/scenarios/de/contentus
Nicht unschick sind übrigens manche Visualisierungen von Wikipedia-Kategorien:
http://toolserver.org/~dapete/catgraph/graph.php?wiki=wikipedia&lang=de…
http://toolserver.org/~dapete/catgraph/graph.php?wiki=wikipedia&lang=de…