Arne Klempert schrieb:
Zur Zeit wird auch an einer CD-Rom-Version
gearbeitet:
http://de.wikipedia.org/wiki/Wikipedia:Wikipedia-CD
Dafür wird die Wikipedia (in diesen Tagen) auf
einem speziell dafür
eingerichteten Mirror eingefroren, um dort
anschließend ein wenig
aufzuräumen (in erster Linie sollen dabei
Löschkandidaten abgearbeitet
werden).
Der so bereinigte Dump wäre ideal, um ihn auch
für andere Ausgabemedien
zu nutzen. Vielleicht könnte Directmedia sogar
ein sauberes XML-Format
zur Verfügung stellen. Das dürfte die
Konvertierung in andere Formate
erheblich vereinfachen.
Klar, sehr gute Idee, machen wir.
Ca. am 22. September hätten wir die XML-Dateien,
wobei zu beachten ist, dass Tabellen und <pre>-
Text als HTML-Dateien bleiben werden. Wäre
das terminlich ok?
Erwin Jurschitza
Directmedia Publishing GmbH
http://www.digitale-bibliothek.de