Hallo zusammen,
Ich w�rde mich gerne an einer Verbesserung der Titel-Suchfunktion (Handling der Doppel-S und Umlauten).
K�nnte mir jemand die folgenden Daten als .zip besorgen * Eine (UTF-8, evtl. XML) Liste mit allen Titeln.
Falls m�glich * Verwendete Suchw�rter unter de.wikipedia.org (Apache Log + ein bischen sed?), so 1-2 MB der letzten Tage w�rde reichen.
Ich mich w�rde mich gerne auf die Algorithmik konzentrieren und w�re daher froh, wenn ich mir vorerst eine Vollinstallation ersparen k�nnte.
Herzlichen Dank Olivier
===== ---------------------------------------------------------- Olivier Chatelain Belpstr. 32, 3007 Bern, Switzerland Home: +41 (0) 31 381 02 27 Office: +41 (0) 31 666 52 45 Mobile: +41 (0) 79 70 70 578 E-mail: o.chatelain@ieee.org ----------------------------------------------------------
Könnte mir jemand die folgenden Daten als .zip besorgen
- Eine (UTF-8, evtl. XML) Liste mit allen Titeln.
http://de.wikipedia.org/wiki/Wikipedia:Download#Download_der_Wikipedia-Stich wortliste
Die Liste ist zwar vom April, aber sicherlich für diese Zwecke erstmal ausreichend. Vielleicht kann ja mal jemand die Liste aktualisieren.
Stefan
* Stefan Kühn kuehns@uni-trier.de [2004-09-16 20:01]:
http://de.wikipedia.org/wiki/Wikipedia:Download#Download_der_Wikipedia-Stich...
Die Liste ist zwar vom April, aber sicherlich für diese Zwecke erstmal ausreichend. Vielleicht kann ja mal jemand die Liste aktualisieren.
done.
Gruß, Matthäus Wander.