Lars Aronsson <lars(a)aronsson.se> writes:
Unter ./text/ liegen OCR-Text in 0001.txt bis 0798.txt
kodiert in ISO
8859-1 (Latin-1). Diese Dateien haben keine Repräsentation für Kursiv
oder Fettstil und auch nicht für grieschische Buchstaben.
Schade, aber es ist nicht so schlimm. Die PG-DP-Leute empfehlen, die
OCR-Ergebnisse als RTF zu speichern und dann mit einem Perl-Script
(gutprep.pl) für
http://www.pgdp.net/ geeignete Umsetzungen vornehmen zu
lassen.
Vielleicht kann jemand bessere OCR-Dateien herstellen?
Ich leider nicht.
Auch korrekturlesen ist nötig. Vielleicht durch
pgdp.net?
Im Laufe des Tages werde ich es unter der ID projectID4167509cc30d2
hochladen; es wird allerdings bestimmt noch 2-3 Monate dauern, bis es an
der Reihe ist. Ich werde auch einmal die Menschen der
Arno-Schmidt-Refbib ansprechen:
http://www.gasl.org/refbib - Arno besaß
lt. Bibl.-Verz. wohl keinen Büchmann, aber für den AS-Forscher sollte
ein Büchmann durchaus hilfreich sein:
http://www.arno-schmidt-stiftung.de/zettel/archiv/BVZ_2003_09.zip
--
| ,__o
| _-\_<,
http://www.gnu.franken.de/ke/ | (*)/'(*)