Lars Aronsson lars@aronsson.se writes:
Unter ./text/ liegen OCR-Text in 0001.txt bis 0798.txt kodiert in ISO 8859-1 (Latin-1). Diese Dateien haben keine Repräsentation für Kursiv oder Fettstil und auch nicht für grieschische Buchstaben.
Schade, aber es ist nicht so schlimm. Die PG-DP-Leute empfehlen, die OCR-Ergebnisse als RTF zu speichern und dann mit einem Perl-Script (gutprep.pl) für http://www.pgdp.net/ geeignete Umsetzungen vornehmen zu lassen.
Vielleicht kann jemand bessere OCR-Dateien herstellen?
Ich leider nicht.
Auch korrekturlesen ist nötig. Vielleicht durch pgdp.net?
Im Laufe des Tages werde ich es unter der ID projectID4167509cc30d2 hochladen; es wird allerdings bestimmt noch 2-3 Monate dauern, bis es an der Reihe ist. Ich werde auch einmal die Menschen der Arno-Schmidt-Refbib ansprechen: http://www.gasl.org/refbib - Arno besaß lt. Bibl.-Verz. wohl keinen Büchmann, aber für den AS-Forscher sollte ein Büchmann durchaus hilfreich sein: http://www.arno-schmidt-stiftung.de/zettel/archiv/BVZ_2003_09.zip