[Wikide-l] Ein neues Projekt, das morgen annonciert werden wird: Wikipedia geht in Druck

Paul Ebermann Paul-Ebermann at gmx.de
Di Apr 22 12:33:55 UTC 2008


Ralf Roletschek schrieb:
>> Eine PDF-Version ist sicher nicht falsch, aber als "transparentes Format" zählt das
>> wohl nicht. (Transparent heißt im GFDL-Kontext vor allem "bearbeitbar", nicht nur
>> "ausdruckbar".)
> 
> Die PDFs von Directmedia sind doch bearbeitbar.

Hmm. Ich vermute, du meinst z.B. das hier:
http://de.wikipedia.org/wiki/Bild:WikiPress_1_Wikipedia.pdf

Kannst du mir sagen, wie ich das mache?

Unser [[PDF]]-Artikel sagt:

> PDF wurde als ein Austauschformat für fertiggestellte Dokumente konzipiert. Inzwischen
> gibt es eine Reihe von Programmen bzw. Erweiterungen für Adobe Acrobat, mit denen sich
> PDF-Dateien bearbeiten lassen. Das Format ist jedoch nicht mit Dateiformaten von
> Textverarbeitungsprogrammen oder Grafikprogrammen vergleichbar und eignet sich,
> abgesehen von der Notiz- und Kommentarfunktion, nur begrenzt zur Weiterverarbeitung von
> Dokumenten. Es ist allerdings innerhalb gewisser Grenzen möglich, beispielsweise
> Tippfehler zu entfernen. Vorteile im Desktop Publishing sind für Grafiker und Designer
> die Einbindung aller Elemente für die Druckerstellung.

Hier der betreffende Ausschnitt aus der GDFL:

> A "Transparent" copy of the Document means a machine-readable copy, represented in a
> format whose specification is available to the general public, that is suitable for
> revising the document straightforwardly with generic text editors or (for images composed
> of pixels) generic paint programs or (for drawings) some widely available drawing editor,
> and that is suitable for input to text formatters or for automatic translation to a
> variety of formats suitable for input to text formatters.

(Ich habe versucht, das Dokument in einem Texteditor zu öffnen,
  und nur Müll erhalten. Die einzigen scheinbar bearbeitbaren Teile waren 
<x:xmpmeta>-XML-Dokumente, offenbar Metadaten für eingebettete Bilder.)

> A copy made in an otherwise Transparent file format whose markup, or absence of markup,
> has been arranged to thwart or discourage subsequent modification by readers is not
> Transparent. An image format is not Transparent if used for any substantial amount of
> text. A copy that is not "Transparent" is called "Opaque".
> 
> Examples of suitable formats for Transparent copies include plain ASCII without markup,
> Texinfo input format, LaTeX input format, SGML or XML using a publicly available DTD, and
> standard-conforming simple HTML, PostScript or PDF designed for human modification.
> Examples of transparent image formats include PNG, XCF and JPG. Opaque formats include
> proprietary formats that can be read and edited only by proprietary word processors, SGML
> or XML for which the DTD and/or processing tools are not generally available, and the
> machine-generated HTML, PostScript or PDF produced by some word processors for output
> purposes only.

Das sieht so aus, als könnte PDF transparent sein ("simple PDF designed for human 
modification"), es aber oft nicht ist - und in diesem Fall neige ich zum zweiten.

Selbst wenn ich das Dokument dekomprimiere (pdftk ... uncompress), wird es nicht besser, 
man kann kein bisschen Text bearbeiten, geschweige denn finden.


Grüße
Paul