Hallo,
"Ilja Lorek" wrote:
Das "allerwichtigste Buch in deutscher
Sprache" (Marcel
Reich-Ranicki) endlich in elektronischer Version - der Digitale
Grimm. Plus ausführliches Benutzerhandbuch! Nur 49,90 EUR (statt
gebundene Ausgabe für 4.990.- EUR)
An dieser Stelle noch ein Hinweis: Es gibt ein
ähnliches Projekt, von
derselben Stelle (Kompetenzzentrum für elektronische Erschliessungs- und
Publikationsverfahren in den Geisteswissenschaften an der Universität
Trier,
http://germa83.uni-trier.de): "Mittelhochdeutsche Wörterbücher
auf CD-ROM und im Internet",
http://www.mwv.uni-trier.de
sind. Und die Digitalisierung selbst - eine sehr
aufwendige Leitung -
von Hand in China eingegeben, von fleissigen Datatypistinen, die kein
Deutsch verstehen durften, um ja keine Fehler durch eigene
Interpretation einzuschmuggeln. Zum OCR-Scannen war die Schriftgröße
und Druckbildqualität angeblich zu klein. Nein, bitte die Hände weg
Um genau zu
sein wurden die beiden von zwei unabhängigen Teams in China
abgetippt. Die beiden Versionen wurden dann verglichen, um eine erste
"Fehlerwelle" auszumerzen. Dann erfolgte die Feinkorrektur von
Hilfskräften mit dem furchtbaren Tustep. *g* Und später dann die
Konvertierung nach SGML(TEI). Parallel dazu wurde auch eine Software
entwickelt, die Suche, Ansicht usw. der Wörterbücher ermöglicht. Die
Engine ist dieselbe für Grimm und für die Mittelhochdeutschen.
Auf Scans wurde verzichtet, da die Fehlerquote zu hoch war
(Frakturschrift, komische Zeichen, ungerade Zeilen, sehr geringe
Zeichen-/Zeilenabstände ...) - außerdem sind die chinesischen
Arbeitskräfte bezahlbar gewesen.
"Karl Eichwalder" wrote:
Etliche Bände sind aber "frei" - es ist ein
Trauerspiel, daß die
DFG-geförderte diese freien Bände nicht als freie Scans
veröffentlicht hat und es spräche auch nichts dagegen, daß von
diese Bänden die OCR-Resultate "frei" ins Netz gestellt würden.
Aber wie üblich, hat man sich als universitäres Institut mal wieder
zur Querfinanzierung der Privatwirtschaft entschieden.
Weniger. Vielmehr wurde ein
sehr umfangreiches und ambitioniertes
Projekt in Zusammenarbeit mit dem Verlag und der DFG realisiert. Diese
Schwarz-Weiß-Malerei trifft hier nicht zu. Ich habe selbst knapp 4 Jahre
an dem Schwester-Projekt (Mittelhochdeutsche Wörterbücher im Verbund auf
CD-ROM) mitgearbeitet - da steckt sehr viel Arbeit drin, natürlich muss
und soll das verkauft und nicht verschenkt werden. Es steht natürlich
jedem frei, die freien Teile der Wörterbücher selbst zu digitalisieren,
aufzubereiten, entsprechende Programme zur Suche, Ansicht etc. zu
entwickeln und das dann zu verschenken ... .
uni-trier ist bisweilen eigenartig langsam.
Auf
dem Server, auf dem die dwb-Seite liegt, laufen auch noch andere
Projekte, da kann es zeitweilig zu Leistungseinbußen kommen.
--
Christian Kohl