Hallo,
"Ilja Lorek" wrote:
Das "allerwichtigste Buch in deutscher Sprache" (Marcel Reich-Ranicki) endlich in elektronischer Version - der Digitale Grimm. Plus ausführliches Benutzerhandbuch! Nur 49,90 EUR (statt gebundene Ausgabe für 4.990.- EUR)
An dieser Stelle noch ein Hinweis: Es gibt ein ähnliches Projekt, von derselben Stelle (Kompetenzzentrum für elektronische Erschliessungs- und Publikationsverfahren in den Geisteswissenschaften an der Universität Trier, http://germa83.uni-trier.de): "Mittelhochdeutsche Wörterbücher auf CD-ROM und im Internet", http://www.mwv.uni-trier.de
sind. Und die Digitalisierung selbst - eine sehr aufwendige Leitung - von Hand in China eingegeben, von fleissigen Datatypistinen, die kein Deutsch verstehen durften, um ja keine Fehler durch eigene Interpretation einzuschmuggeln. Zum OCR-Scannen war die Schriftgröße und Druckbildqualität angeblich zu klein. Nein, bitte die Hände weg
Um genau zu sein wurden die beiden von zwei unabhängigen Teams in China abgetippt. Die beiden Versionen wurden dann verglichen, um eine erste "Fehlerwelle" auszumerzen. Dann erfolgte die Feinkorrektur von Hilfskräften mit dem furchtbaren Tustep. *g* Und später dann die Konvertierung nach SGML(TEI). Parallel dazu wurde auch eine Software entwickelt, die Suche, Ansicht usw. der Wörterbücher ermöglicht. Die Engine ist dieselbe für Grimm und für die Mittelhochdeutschen. Auf Scans wurde verzichtet, da die Fehlerquote zu hoch war (Frakturschrift, komische Zeichen, ungerade Zeilen, sehr geringe Zeichen-/Zeilenabstände ...) - außerdem sind die chinesischen Arbeitskräfte bezahlbar gewesen.
"Karl Eichwalder" wrote:
Etliche Bände sind aber "frei" - es ist ein Trauerspiel, daß die DFG-geförderte diese freien Bände nicht als freie Scans veröffentlicht hat und es spräche auch nichts dagegen, daß von diese Bänden die OCR-Resultate "frei" ins Netz gestellt würden. Aber wie üblich, hat man sich als universitäres Institut mal wieder zur Querfinanzierung der Privatwirtschaft entschieden.
Weniger. Vielmehr wurde ein sehr umfangreiches und ambitioniertes Projekt in Zusammenarbeit mit dem Verlag und der DFG realisiert. Diese Schwarz-Weiß-Malerei trifft hier nicht zu. Ich habe selbst knapp 4 Jahre an dem Schwester-Projekt (Mittelhochdeutsche Wörterbücher im Verbund auf CD-ROM) mitgearbeitet - da steckt sehr viel Arbeit drin, natürlich muss und soll das verkauft und nicht verschenkt werden. Es steht natürlich jedem frei, die freien Teile der Wörterbücher selbst zu digitalisieren, aufzubereiten, entsprechende Programme zur Suche, Ansicht etc. zu entwickeln und das dann zu verschenken ... .
uni-trier ist bisweilen eigenartig langsam.
Auf dem Server, auf dem die dwb-Seite liegt, laufen auch noch andere Projekte, da kann es zeitweilig zu Leistungseinbußen kommen.
Hallo,
"Ilja Lorek" wrote:
Das "allerwichtigste Buch in deutscher Sprache" (Marcel
Diese Schwarz-Weiß-Malerei trifft hier nicht zu. Ich habe selbst knapp 4 Jahre an dem Schwester-Projekt (Mittelhochdeutsche Wörterbücher im Verbund auf CD-ROM) mitgearbeitet - da steckt sehr viel Arbeit drin, natürlich muss und soll das verkauft und nicht verschenkt werden. Es steht natürlich jedem frei, die freien Teile der Wörterbücher selbst zu digitalisieren, aufzubereiten, entsprechende Programme zur Suche, Ansicht etc. zu entwickeln und das dann zu verschenken ... .
uni-trier ist bisweilen eigenartig langsam.
Auf dem Server, auf dem die dwb-Seite liegt, laufen auch noch andere Projekte, da kann es zeitweilig zu Leistungseinbußen kommen.
Danke Christian
für das Votum, die 2 CD-ROMs sind natürlich recht preiswert (die letzte Studienausgabe ist oder war noch für 499 Euro zu haben). Nicht alles, was auch etwas kostet, sollte uns Wikipedianern als Feind oder das Böse erscheinen, wir leben nun einmal in einer Welt, in der das liebe Geld eine (über)mächtige Rolle spielt!
Und in dem wir uns hier für den enormen Luxus der freiwilligen Gratisarbeit an der Online-Enzyklopädie entschieden haben, haben wir uns noch nicht über die die Zwänge erhoben, einem bezahlten Job nachzugehen und den eigenen Lebensunterhalt auch noch bezahlen zu können.
Drum achten wir die Arbeit der anderen Menschen und hoffen, dass die fleißigen Chinesinnen bei diesem Projekt nicht all zu kurz gekommen sind. Unsere altruistische Haltung in aller Ehren, doch nicht jeder, der mit uns nicht diesen schönen Luxus teilt, ist gleichzeitig ein Trottel, Schuft oder eine Kombination von Beidem!
Denn es gibt genug Menschen unter uns, die haben zwei oder drei Jobs um ihre Familie knapp ernähren zu können, ihnen kommt unsere Idee von einer unbezahlten Arbeit, wie eine Vorstellung vom Spaziergang auf der umgekehrten Mondseite vor.
Aber zurück zu den Gebrüder Grimm, mich beeindruckt vor allem die lange Entstehungsgeschichte - und eigentlich ist dieses Wörterbuch auch heute noch nicht abgeschlossen - und wird es nie werden. Wie die Wikipedia!
Gruß Ilja
Christian Kohl kohl@uni-koblenz.de writes:
Auf Scans wurde verzichtet, da die Fehlerquote zu hoch war (Frakturschrift, komische Zeichen, ungerade Zeilen, sehr geringe Zeichen-/Zeilenabstände ...) - außerdem sind die chinesischen Arbeitskräfte bezahlbar gewesen.
Ja, das ist klar und dagegen ist auch nicht einzuwenden. Man sollte die rohen Scans gleichwohl zugänglich machen (als tiff, pdf, oder was auch immer), damit man a) im Zweifelsfall dort einmal nachsehen kann und b) damit man als heutiger Leser überhaupt einen Eindruck gewinnt, wie die Brüder Grimm im 19. Jh. das Projekt begonnen haben. Es wäre schön gewesen, wenn die uni-trier.de das miterledigt hätte. Natürlich nur für die Seiten, die "frei" sind.
da steckt sehr viel Arbeit drin, natürlich muss und soll das verkauft und nicht verschenkt werden.
Das da viel Arbeit drin steckt, habe ich nie bezweifelt. Mir ist aber nur nicht klar, warum das verkauft werden "muß". Erwartet die DFG einen Geldrückfluß? Ich erwarte auch keineswegs, daß mir das alles geschenkt wird. Ich erwarte nur, daß "freie" Inhalte nicht wieder unfrei gemacht werden.
Der ganze Mehrwert kann meinetwegen gern verkauft werden. Aber die Scans bzw. ein simpler ASCII-Output (unformatiert) sollte zumindest frei zugänglich veröffentlicht werden. So etwas sollten sich die Wissenschaftler im 21. Jh. einfach selbst schuldig sein. Und aus Gründen den Nachhaltigkeit sollte auch die getaggte Quellcode (SGML/XML) zur Verfügung stehen und Massenhaft vervielfälltigt werden (mit digitaler Prüfsumme, etc. pp.). Sonst fängt man in ein paar Jahren wieder an, das Zeug zu digitalisieren...
Auf dem Server, auf dem die dwb-Seite liegt, laufen auch noch andere Projekte, da kann es zeitweilig zu Leistungseinbußen kommen.
Ein gRund mehr, warum man auch ohne CD-Erwerb auf die Inhalte anderweitig zugreifen können sollte.
----- Original Message ----- From: "Karl Eichwalder" ke@gnu.franken.de To: wikide-l@wikipedia.org
kein Grund mehr, warum man auch ohne CD-Erwerb auf die Inhalte anderweitig zugreifen können sollte.
es gibt nicht nur Wikipedianer auf der Welt und wenn es die Käufer nicht bezahlen, dann muss es meistens der Vater Staat bezahlen, also schon wieder wir!
Doch längerfristig könnte die Wikipedia wirklich zum Vorbild werden und die Inhalte von anderen Werken neben der CD auch auf dem Server frei zugänglich werden (wie z. B. aeiou.at). Bis dahin sollten wir aber auch bisschen was zeigen, dass es einen Sinn und eine Chance hat und das so ein Projekt eine Zukunft haben kann.
Gruß Ilja
Karl Eichwalder wrote:
Das da viel Arbeit drin steckt, habe ich nie bezweifelt. Mir ist aber nur nicht klar, warum das verkauft werden "muß". Erwartet die DFG einen Geldrückfluß?
Ewig kann man darüber theoretisieren. DFG kann man aber vermutlich nicht überzeugen. Was man doch tun kann, hat uns Christian Aschoff gezogen: Alte Nachschlagewerke selbst digitalisieren! Warum machen dann so wenig von uns genau das? Wie kommen wir weiter?
Lars Aronsson, lars@aronsson.se
On Fri, 1 Oct 2004 05:20:25 +0200 (CEST) Lars Aronsson lars@aronsson.se wrote:
Alte Nachschlagewerke selbst digitalisieren! Warum machen dann so wenig von uns genau das? Wie kommen wir weiter?
Fuer Wikiquote wurde angeregt, gemeinfreie Ausgaben des Buechmann zu scannen, aber dieses Projekt bewegt sich leider auf einem eher niedrigen Hobby-Niveau und hat vergleichweise wenig Interesse an exakten Quellenangaben:
http://de.wikiquote.org/wiki/Diskussion:Hauptseite#Urheberrecht_und_Quellena...
Klaus Graf
"Klaus Graf" klaus.graf@geschichte.uni-freiburg.de writes:
Fuer Wikiquote wurde angeregt, gemeinfreie Ausgaben des Buechmann zu scannen, aber dieses Projekt bewegt sich leider auf einem eher niedrigen Hobby-Niveau und hat vergleichweise wenig Interesse an exakten Quellenangaben:
http://de.wikiquote.org/wiki/Diskussion:Hauptseite#Urheberrecht_und_Quellena...
Wenn jemand ein solches Buch scannt (möglichst nichtFraktur!), dann bin ich gern bereit, es durch http://www.pgdp.net [Distributed Proofreaders] zu schleusen. In der German-Queue warten allerdings noch weitere ca. 20 Bände. Also ran!
Lars Aronsson lars@aronsson.se writes:
Ewig kann man darüber theoretisieren. DFG kann man aber vermutlich nicht überzeugen.
Direkt nicht, aber letztlich bewilligen die alles nach so einer Mischung zwischen Quoten- und Zufallsprinzip. Sobald entsprechende Anträge eingereicht werden, werden auch die bewilligt werden.
Die Antragsteller müssen also aufwachen.
Was man doch tun kann, hat uns Christian Aschoff gezogen: Alte Nachschlagewerke selbst digitalisieren! Warum machen dann so wenig von uns genau das?
Weiß ich nicht. Ich habe zuletzt ein PDF-Experiment ins Netz gestellt:
http://www.gnu.franken.de/Tieck/Dokumente/burgsdorff-briefe/
Es ist wahrscheinlich OCR-fähig - falls sich daran jemand versuchen möchte, nur zu. Bei anderen Digitalisierungsprojekten bin ich auch gern behilflich, wenn es sich zeitlich einrichten läßt.
Wie kommen wir weiter?
Bei gutenberg.org stapern sich auch die fertigen Werke, die nur noch jemand PP'en (post-processing) müßte. PPing ist dort der Schritt, der nach OCR und 2 x Korrekturlesen kommt.