David Daester schrieb:
Hergestellt heisst hier wohl vermutlich: Engescannt, OCR, und ein "bischen" Formatiert. Obwohl das "bischen" sehr schnell viel wird.
Aufwand für die Digitaliserung war sicher vorhanden, aber dürfte man den Text daraus selber Abschreiben? (Nene, nicht Copy+Paste)
Bei der ADB (Allgemeine Deutsche Biographie) und der BSB (Bayerische Staatsbibliothek) gab es noch kein Aufwand für OCR. Genau das ist das Problem. Ich möchte gern einen OCR-Text erzeugen, aber dann brauche ich die hoch aufgelöste Bilder die BSB eingescannt hat. An diese kann ich aber nicht zugreiffen. BSB veröffentlicht nur Bilder in niedriger Auflösung, die für OCR unbrauchbar sind. Und selbst stellt BSB kein OCR-Text dar. Nur gucken, nicht suchen!
Die Lösung ist vermutlich das ganze Werk noch einmal einzuscannen...
-- Lars Aronsson (lars@aronsson.se) Projekt Runeberg - freie nordische Literatur - http://runeberg.org/