Hallo - ich plane gerade meine Diplomarbeit (Informatik). Meine Idee ist es, die Inhalte und Strukturen der Wikipedia zum Aufbau eines ontologischen Wörterbuches zu nutzen, ähnlich WordNet und dem Wortschatz-Projekt. Die Diplomarbeit wird veruassichtlich von Herrn Prof. Quasthoff betreut, der auch das Wortschatz-Projekt leitet; Die Daten sollen in dieses Projekt einfliessen oder zumindest damit verknüpft werden. Ich hoffe auch, die Daten in der ein oder anderen Form für die Wikipedia nutzbar zu machen.
Eine Ideensammlung befindet sich in meinem Wiki unter http://brightbyte.de/wiki/index.php?id=WikiWordExtraction. Über Kommentare und Anregungen würde ich mich freuen!
Auch bezüglich der Lizenz habe ich noch Fragen. Insbesondere: Wenn auch auf die Sammlung und Strukturierung von Begriffen ein Urheberrecht besteht, wie müsste eine Datenbank die aus der Analyse solcher Strukturen generiert wurde lizensiert werden? Wie kann ich dem Anspruch der GFDL, alle Autoren zu nenne, hier gerecht werden? Ich habe vor, das Ergebnis als freie Daten zu veröffentlichen, aber die juristisch-technischen Details sind mir unklar...
Gruss, Daniel