New subject: Wikipedia ist kein Wörterbuch

28 Sep 2004


      Hallo,
"Ilja Lorek" wrote:
...
Das "allerwichtigste Buch in deutscher Sprache" (Marcel
Reich-Ranicki) endlich in elektronischer Version - der Digitale
Grimm. Plus ausfÃ¼hrliches Benutzerhandbuch! Nur 49,90 EUR (statt
gebundene Ausgabe fÃ¼r 4.990.- EUR)
An dieser Stelle noch ein Hinweis: Es gibt ein ähnliches Projekt, von 
derselben Stelle (Kompetenzzentrum für elektronische Erschliessungs- und 
Publikationsverfahren in den Geisteswissenschaften an der Universität 
Trier, http://germa83.uni-trier.de): "Mittelhochdeutsche Wörterbücher 
auf CD-ROM und im Internet", http://www.mwv.uni-trier.de
...
sind. Und die Digitalisierung selbst - eine sehr aufwendige Leitung -
von Hand in China eingegeben, von fleissigen Datatypistinen, die kein
Deutsch verstehen durften, um ja keine Fehler durch eigene
Interpretation einzuschmuggeln. Zum OCR-Scannen war die Schriftgröße
und Druckbildqualität angeblich zu klein. Nein, bitte die Hände weg
Um genau zu sein wurden die beiden von zwei unabhängigen Teams in China 
abgetippt. Die beiden Versionen wurden dann verglichen, um eine erste 
"Fehlerwelle" auszumerzen. Dann erfolgte die Feinkorrektur von 
Hilfskräften mit dem furchtbaren Tustep. *g* Und später dann die 
Konvertierung nach SGML(TEI). Parallel dazu wurde auch eine Software 
entwickelt, die Suche, Ansicht usw. der Wörterbücher ermöglicht. Die 
Engine ist dieselbe für Grimm und für die Mittelhochdeutschen.
Auf Scans wurde verzichtet, da die Fehlerquote zu hoch war 
(Frakturschrift, komische Zeichen, ungerade Zeilen, sehr geringe 
Zeichen-/Zeilenabstände ...) - außerdem sind die chinesischen 
Arbeitskräfte bezahlbar gewesen.
"Karl Eichwalder" wrote:
...
Etliche BÃ¤nde sind aber "frei" - es ist ein Trauerspiel, daÃŸ die
DFG-gefÃ¶rderte diese freien BÃ¤nde nicht als freie Scans
verÃ¶ffentlicht hat und es sprÃ¤che auch nichts dagegen, daÃŸ von
diese BÃ¤nden die OCR-Resultate "frei" ins Netz gestellt wÃ¼rden.
Aber wie Ã¼blich, hat man sich als universitÃ¤res Institut mal wieder
zur Querfinanzierung der Privatwirtschaft entschieden.
Weniger. Vielmehr wurde ein sehr umfangreiches und ambitioniertes 
Projekt in Zusammenarbeit mit dem Verlag und der DFG realisiert. Diese 
Schwarz-Weiß-Malerei trifft hier nicht zu. Ich habe selbst knapp 4 Jahre 
an dem Schwester-Projekt (Mittelhochdeutsche Wörterbücher im Verbund auf 
CD-ROM) mitgearbeitet - da steckt sehr viel Arbeit drin, natürlich muss 
und soll das verkauft und nicht verschenkt werden. Es steht natürlich 
jedem frei, die freien Teile der Wörterbücher selbst zu digitalisieren, 
aufzubereiten, entsprechende Programme zur Suche, Ansicht etc. zu 
entwickeln und das dann zu verschenken ... .
...
uni-trier ist bisweilen eigenartig langsam.
Auf dem Server, auf dem die dwb-Seite liegt, laufen auch noch andere 
Projekte, da kann es zeitweilig zu Leistungseinbußen kommen.
-- 
Christian Kohl

Re: Wikipedia ist kein Wörterbuch