Unten stehende Mail habe ich an gmane.comp.openoffice.general.german geschickt. Ja, es betrifft wikipedia teilweise. Wer mehr wissen will, kann sich ja mal http://de.wikipedia.org/wiki/Benutzer:Mathias_Schindler/concise ansehen.
Gibt es einen Openoffice-Nutzer hier, der vielleicht einen Tipp parat hat?
Mathias
---- Hallo liebe Liste und ein frohes neues Jahr,
ich habe gerade ein kleineres Projekt laufen, bei dem ein Glossar erstellt werden soll. Jeder Eintrag hat einen Titel und einen kleineren Text. Ich habe OpenOffice Write gewählt, um diesen Text in eine ansehnliche Form zu bringen und daraus nachher ein PDF zu backen. Gerade das Austreiben von angefangenen Zeilen, Spaltensatz und die Absatzkontrolle (...und die Lizenz) waren ein Hauptgrund.
Gibt es nun einen Weg, einen strukturierten Text so zu importieren, daß einzelnen Teilen einzelne Formatvorlagen zugewiesen werden können?
Im Moment enthält meine Glossar-Formatvorlage zwei Zeichenvorlagen ("Begriff" und "Erklärung").
Die Texte des Glossars liegen in einer Form vor, die in etwa so geht:
... <lemma> <begriff>Apfelbaum</begriff> <erklaerung>Der Apfelbaum ist ein Baum, an dem Äpfel hängen</erklaerung> </lemma> ...
der Text in <begriff> sollte der Zeichenvorlage Begriff zugewiesen werden, <erklaerung> an die Zeichenvorlage Erklärung.
Ich habe an einem Nachmittag mal scherzhafterweise probiert, den XML-Text des OpenOffce-Dokuments per Hand zu schreiben (glossar.sxw in glossar.zip geändert und entpackt), aber damit bin ich nicht sehr weit gekommen.
Ich habe auf search.gmane.org gesucht, ob es schonmal eine ähnliche Frage gab, bin aber nicht weitergekommen, vielleicht habe ich die falschen Suchbegriffe verwendet.
Kann mir jemand noch einen Tipp geben, wie das geschickt geht?
Viele liebe Grüße, Mathias Schindler
Am Sonntag, 2. Januar 2005 16:12 schrieb Mathias Schindler:
Unten stehende Mail habe ich an gmane.comp.openoffice.general.german geschickt. Ja, es betrifft wikipedia teilweise. Wer mehr wissen will, kann sich ja mal http://de.wikipedia.org/wiki/Benutzer:Mathias_Schindler/concise ansehen.
Gibt es einen Openoffice-Nutzer hier, der vielleicht einen Tipp parat hat?
Mathias
Halte ich für prinzipiell machbar (weil Du auf Bilder erstmal verzichten willst), allerdings musst Du vermutlich die einzelnen Bausteine der Open-Office-Datei separat erzeugen. Kern ist wohl die content.xml. Die könntest Du möglicherweise mit einem XSLT-Prozessor erzeugen:
Meines Wissens gibt es einen freien XSLT-Prozessor irgendwo im Apache-Umfeld. Im Grunde musst Du die content.xml analysieren, und dann ein Stylesheet schreiben, das von Deinem XML-Format in das Format der content.xml übersetzt. Das fütterst Du samt Quell-XML in des XSLT-Prozessor, und der sollte dann (in der Theorie) den Rest erledigen.
Uli
Ulrich Fuchs wrote:
Unten stehende Mail habe ich an gmane.comp.openoffice.general.german geschickt.
..wo sie bislang wohl noch nicht angekommen ist, dank eines falsch eingerichteten email clients. *seufz*. Das neue Jahr.
Halte ich für prinzipiell machbar (weil Du auf Bilder erstmal verzichten willst),
Bilder sind nicht die höchste Priorität und auch sonst geht viel mehr Reiz vom Tex aus, richtig.
Im Grunde musst Du die content.xml analysieren, und dann ein Stylesheet schreiben, das von Deinem XML-Format in das Format der content.xml übersetzt. Das fütterst Du samt Quell-XML in des XSLT-Prozessor, und der sollte dann (in der Theorie) den Rest erledigen.
OpenOffice.org 2.0 hat (ich habe das mal in einer frühen Beta installiert) offenbar eine sehr klare Schnittstelle für den Import von Text in unterschiedlichen Formaten. Sie machen offenbar auch das Schreiben von Import-Werkzeugen sehr einfach. Über diesen Weg könnte man wohl einiges an Zeit und Fehlern sparen.
Die ooo-Seiten sind da sehr reichhaltig und bergen erstmal recht viel Lesestoff.
http://xml.openoffice.org/filter/ sieht nach einem guten Start aus.
Und wenn man http://framework.openoffice.org/proposals/filters/exportfilters.html liesst, fühlt man sich gleich heimisch bei denen.
Und so weiter. Spannende Sache.
Mathias
On Mon, Jan 03, 2005 at 11:33:59AM +0100, Mathias Schindler wrote:
OpenOffice.org 2.0 hat (ich habe das mal in einer frühen Beta installiert) offenbar eine sehr klare Schnittstelle für den Import von Text in unterschiedlichen Formaten. Sie machen offenbar auch das Schreiben von Import-Werkzeugen sehr einfach. Über diesen Weg könnte man wohl einiges an Zeit und Fehlern sparen.
Ich würd ehrlich gesagt nicht lange mit OOo rumscheißen sondern lieber ein ordentliches DTP wie Scribus verwenden. Der einzige Nachteil ist dass Scribus nur auf Un*x läuft. Interessanter fände ich es aber den PDF-Export auf mehrere Rechner verteilen zu können. Beim WR Digest oder auch WR Internet braucht mein oller 750Mhz schon ein paar Minuten.
Bei den WikiReadern die ich ja immer noch mit OOo mache (wahrscheinlich steig ich bei scribus 1.4 um) ist es nur cut'n'paste aber eine konvertierung per script wäre natürlich praktischer und schneller. Bei den Bildern würde ich aber erstmal bei manueller Nacharbeit bleiben.
ciao, tom
Ich würd ehrlich gesagt nicht lange mit OOo rumscheißen sondern lieber ein ordentliches DTP wie Scribus verwenden. Der einzige Nachteil ist dass Scribus nur auf Un*x läuft.
Ein viel gravierenderer Nachteil ist, dass Scribus ein ordentliches DTP ist. Abgesehen davon, dass die Import-Funktionen von Scribus noch lange nicht weit genug sind, um damit was sinnvolles anfangen zu können, ist das Problem hier (spätestens wenn Du mit Bildern anfängst), dass Du die Bilder nicht an den Text koppelst sondern die Bilder erst da sind und der Text dann drum rum fließt.
Die ganze Thematik, automatisiert einen beliebigen Text (am besten noch mit Tabellen, Bildern etc.) auf DIN-A4 Seiten aufzubrechen, und das ganze noch gut ausschauen zu lassen, ist alles andere als trivial. In der Theorie hört sich alles ganz wunderbar an, in der Praxis sind die Steine auf dem Weg doch so einige.
Uli
Ulrich Fuchs wrote:
Die ganze Thematik, automatisiert einen beliebigen Text (am besten noch mit Tabellen, Bildern etc.) auf DIN-A4 Seiten aufzubrechen, und das ganze noch gut ausschauen zu lassen, ist alles andere als trivial. In der Theorie hört sich alles ganz wunderbar an, in der Praxis sind die Steine auf dem Weg doch so einige.
In der Praxis kommt dem LaTeX doch schon ziemlich nahe...
Flups
In der Praxis kommt dem LaTeX doch schon ziemlich nahe...
Außer Du versuchst, mit vielen Bildern zu arbeiten, die dann auch noch als Freisteller haben zu wollen, natürlich neben dem Text zu dem sie gehören (und nicht sonstwo), und dann vielleicht noch dreispaltig drucken zu wollen - so schnell kannst Du gar nicht kucken, wie schnell Latex da aufgibt.
Uli
Thomas R. Koll wrote:
Ich würd ehrlich gesagt nicht lange mit OOo rumscheißen sondern lieber ein ordentliches DTP wie Scribus verwenden
Ich habe mir Scribus angesehen und es hat noch lange nicht die Funktionen, die ich jetzt gerade brauche. Das ist keine Absage an Scribus. Wenn jemand meint, mit Scribus besser zurecht zu kommen (und ich kann nicht ausschließen, daß ich das bald meine), soll er mir bitte gerne seine Erfahrungen damit mitteilen.
Interessanter fände ich es aber den PDF-Export auf mehrere Rechner verteilen zu können.
Der PDF-Export läuft hier für meinen Geschmack schnell genug, wenn es um einige Seiten geht. Wie das mit ein paar Seiten mehr aussieht und ob es immer gleich ein kompletter Export sein muss, steht auf einem anderen Blatt.
Bei den WikiReadern die ich ja immer noch mit OOo mache (wahrscheinlich steig ich bei scribus 1.4 um)
feedback erwünscht, siehe oben
ist es nur cut'n'paste
ja. Habe ich einmal für ein kleines mock-up gemacht und nie wieder.
aber eine konvertierung per script wäre natürlich praktischer und schneller.
ja.
Bei den Bildern würde ich aber erstmal bei manueller Nacharbeit bleiben.
Kann ich nicht ausschließen oder sonstwie.
Weiss jemand, ob Scribus überhaupt in der Lage ist, ein - sagen wir mal - 500 Seiten starkes Dokument zu verwalten? Oder ein 1000 Seiten starkes. Oder 1000 Seiten bei drei Spalten und 6pt-Schrift. (...) Von ooo weiss ich es mittlerweile einigermaßen und wenn nicht, hat sun/ooo eine hinreichend starke Nutzer- und Entwicklerbasis, sich dieses Problems anzunehmen (imho).
Mathias