Hallo,
"Ilja Lorek" wrote:
Das "allerwichtigste Buch in deutscher Sprache" (Marcel Reich-Ranicki) endlich in elektronischer Version - der Digitale Grimm. Plus ausführliches Benutzerhandbuch! Nur 49,90 EUR (statt gebundene Ausgabe für 4.990.- EUR)
An dieser Stelle noch ein Hinweis: Es gibt ein ähnliches Projekt, von derselben Stelle (Kompetenzzentrum für elektronische Erschliessungs- und Publikationsverfahren in den Geisteswissenschaften an der Universität Trier, http://germa83.uni-trier.de): "Mittelhochdeutsche Wörterbücher auf CD-ROM und im Internet", http://www.mwv.uni-trier.de
sind. Und die Digitalisierung selbst - eine sehr aufwendige Leitung - von Hand in China eingegeben, von fleissigen Datatypistinen, die kein Deutsch verstehen durften, um ja keine Fehler durch eigene Interpretation einzuschmuggeln. Zum OCR-Scannen war die Schriftgröße und Druckbildqualität angeblich zu klein. Nein, bitte die Hände weg
Um genau zu sein wurden die beiden von zwei unabhängigen Teams in China abgetippt. Die beiden Versionen wurden dann verglichen, um eine erste "Fehlerwelle" auszumerzen. Dann erfolgte die Feinkorrektur von Hilfskräften mit dem furchtbaren Tustep. *g* Und später dann die Konvertierung nach SGML(TEI). Parallel dazu wurde auch eine Software entwickelt, die Suche, Ansicht usw. der Wörterbücher ermöglicht. Die Engine ist dieselbe für Grimm und für die Mittelhochdeutschen. Auf Scans wurde verzichtet, da die Fehlerquote zu hoch war (Frakturschrift, komische Zeichen, ungerade Zeilen, sehr geringe Zeichen-/Zeilenabstände ...) - außerdem sind die chinesischen Arbeitskräfte bezahlbar gewesen.
"Karl Eichwalder" wrote:
Etliche Bände sind aber "frei" - es ist ein Trauerspiel, daß die DFG-geförderte diese freien Bände nicht als freie Scans veröffentlicht hat und es spräche auch nichts dagegen, daß von diese Bänden die OCR-Resultate "frei" ins Netz gestellt würden. Aber wie üblich, hat man sich als universitäres Institut mal wieder zur Querfinanzierung der Privatwirtschaft entschieden.
Weniger. Vielmehr wurde ein sehr umfangreiches und ambitioniertes Projekt in Zusammenarbeit mit dem Verlag und der DFG realisiert. Diese Schwarz-Weiß-Malerei trifft hier nicht zu. Ich habe selbst knapp 4 Jahre an dem Schwester-Projekt (Mittelhochdeutsche Wörterbücher im Verbund auf CD-ROM) mitgearbeitet - da steckt sehr viel Arbeit drin, natürlich muss und soll das verkauft und nicht verschenkt werden. Es steht natürlich jedem frei, die freien Teile der Wörterbücher selbst zu digitalisieren, aufzubereiten, entsprechende Programme zur Suche, Ansicht etc. zu entwickeln und das dann zu verschenken ... .
uni-trier ist bisweilen eigenartig langsam.
Auf dem Server, auf dem die dwb-Seite liegt, laufen auch noch andere Projekte, da kann es zeitweilig zu Leistungseinbußen kommen.