Marco S. schrieb:
Kann man mithilfe von Perl/PHP/VB.NET/VC sich einen solchen Konverter basteln? Sowas juckt mich auch schon seit langem...
PS: Wenn die WM-Sources nicht so unstrukturiert wären, könnte ich die Parser rausholen(mithilfe meines Apache/XAMPP)
Ohne MediaWiki wird es dank der vielen Extras und Besonderheiten des Wikitext-Codes wohl schwierig werden. Das Aufsplitten des XML-dumps in einzelne Dateien (Tip: als Dateiname wegen Sonderzeichen die interne ID und nicht den Titel verwenden, siehe auch [1]) ist noch trivial aber schon das Ersetzen aller Vorlagen ist ein Akt. Ist aber möglich und würde mich auch sehr interessieren. Es gibt übrigens schon mehrere Versuche eines Parsers für Wikitext. Die Dateinamen der Bilder lassen sich übrigens aus ihrem Namen berechnen.
Gruß, Jakob
[1] http://meta.wikimedia.org/wiki/User:Nichtich/Process_MediaWiki_XML_export