Daniel Kinzler schrieb
Eine Ideensammlung befindet sich in meinem Wiki unter http://brightbyte.de/wiki/index.php?id=WikiWordExtraction. Über Kommentare und Anregungen würde ich mich freuen!
Schau dir mal die Arbeiten von Francesco Bellomi http://www.fran.it/blog/ sowie die von Rudi Cilibrasi http://www.arxiv.org/abs/%20cs.CL/0412098 und http://www.newscientist.com/article.ns?id=dn6924 an. Fancesco kommt auch zur Wikimania.
Es würde mich freuen, wenn du deine Literatur und weitere interessante Quellen unter http://de.wikipedia.org/wiki/Wikipedia:Wikipedistik bzw. http://de.wikipedia.org/wiki/Wikipedia:Wikipedistik/Bibliographie hinzufügst (die ganze Seite sollte eigentlich nach meta umziehen, aber ich bin noch nicht zum Aufräumen gekommen)
Auch bezüglich der Lizenz habe ich noch Fragen. Insbesondere: Wenn auch auf die Sammlung und Strukturierung von Begriffen ein Urheberrecht besteht, wie müsste eine Datenbank die aus der Analyse solcher Strukturen generiert wurde lizensiert werden? Wie kann ich dem Anspruch der GFDL, alle Autoren zu nenne, hier gerecht werden? Ich habe vor, das Ergebnis als freie Daten zu veröffentlichen, aber die juristisch-technischen Details sind mir unklar...
Da du nur die Struktur herausziehst und mit deinen Methoden bearbeitest, dürfte es außer dir keine Hauptautoren mehr geben. Wenn du hingegen beispielsweise alle Artikel über Feuerwehren herausziehst und sich herausstellt, dass die gesamten Artikel von einer Handvoll Autoren stammen, dürfte es anders aussehen, aber gerade bei der Verlinkung sind oft so viele verschiedenen Autoren beteiligt, dass eigentlich niemand eine herausragende Autorenschaft anmelden können dürfte.
Gruß, Jakob