Arne Klempert schrieb:
Zur Zeit wird auch an einer CD-Rom-Version gearbeitet: http://de.wikipedia.org/wiki/Wikipedia:Wikipedia-CD
Dafür wird die Wikipedia (in diesen Tagen) auf einem speziell dafür eingerichteten Mirror eingefroren, um dort anschließend ein wenig aufzuräumen (in erster Linie sollen dabei Löschkandidaten abgearbeitet werden).
Der so bereinigte Dump wäre ideal, um ihn auch für andere Ausgabemedien zu nutzen. Vielleicht könnte Directmedia sogar ein sauberes XML-Format zur Verfügung stellen. Das dürfte die Konvertierung in andere Formate erheblich vereinfachen.
Klar, sehr gute Idee, machen wir.
Ca. am 22. September hätten wir die XML-Dateien, wobei zu beachten ist, dass Tabellen und <pre>- Text als HTML-Dateien bleiben werden. Wäre das terminlich ok?
Erwin Jurschitza Directmedia Publishing GmbH http://www.digitale-bibliothek.de