Re: [Wikide-l] Re: Konvertierung auf Unicode

24 Apr 2004


      Karl Eichwalder wrote:
...
...
Ich meine, dass man hier einen Unterschied zwischen Sprachen machen
sollte, die sich der Lateinschrift bedienen, und solchen, für die das
nicht gilt. Klar, statt oder neben Чехов kann ruhig die übliche deutsche
Umschrift "Tschechow" stehen, und auf die sog. wissenschaftliche
Transliteration "Čechov" kann man vielleicht ganz verzichten,
"Čehov" müßte es heißen, wenn ich das system richtig verstanden habe.
ich würde nicht darauf verzichten, weil früher oder später jemand diese
variante sowieso einfügen wird und weil selbstverständlich auch
wissenschaftler den artikel finden sollten.
Nach dem in der deutschen Slavistik und den meisten deutschen 
Bibliotheken üblichen System heißt er "Čechov", es gibt aber auch 
Systeme, wo er "Čehov" geschrieben wird. In die deutsche Wikipedia 
gehört daher eher "Čechov".
...
...
wenn man die kyrillische Originalschreibung anführt. Aber wenn man aus
"Lech Wałęsa" "Lech Walesa" macht oder aus "České Budějovice" "Ceske
Budejovice",
es war ja meinerseits auch nicht die rede davon, einfach der 8. bit
wegzuwerfen (leider wird das in der WP wohl des öfteren so gehandhabt
).  es gibt bestimmt auch für polnisch und tschechisch diese
regeln, die eine möglichst genaue abbildung mit ASCII (oder ISO-8859-1)
erlauben.  meinen namen schreiben die amerikaner zwar "richtig", aber
die aussprache ist ihnen nicht so ohne weiteres klar.  ich würde es
durchaus akzeptieren, wenn sie meinen namen anders schrieben.
Solche Regeln gibt es nicht, höchstens als Privatkonvention von 
irgendwelchen Leuten.
...
...
Im Übrigen braucht man für die Zusatzzeichen zur Lateinschrift nicht
einmal Unicode.
wie meinen?  "Wałęsa" ist mit iso-8859-1 nicht angedeckt.  es bleibt
also nur, ein dateiformat wie HTML zunehmen und entities zu verwenden
oder eine dateikodierung, bei der man mehrere encodings mischen kann
(emacs-mule, iso 2022: http://en.wikipedia.org/wiki/ISO_2022 ).  ich
glaube aber kaum, daß wir encodings mischen wollen und wir wollen
bestimmt auch nicht ein paar artikel in iso-8859-2 und den rest in
iso-8859-1 haben wollen.  also brauchen wir Unicode und als kodierung
UTF-8.
Mit "iso-8859-1" ist es nicht abgedeckt, da braucht man schon 
"iso-8859-2" (was bei Mozilla übrigens als Central European beeichnet 
wird). Aber wenn die ganze Enzyklopädie in "iso-8859-1" wäre, fände ich 
das eh nicht toll. Gegen die Unicode-Version habe ich im Übrigen auch 
nichts, da ginge ja alles das, was ich für sinnvoll halte (und noch 
einiges mehr...).
Gruß
Tilman
-- 
Tilman Berger
Slavisches Seminar
Universitaet Tuebingen
Wilhelmstr. 50
D-72074 Tuebingen

Tel. +7071/2976733 - +160/99129805
Fax: +7071/295924
e-mail: tberger@uni-tuebingen.de
Homepage: http://homepages.uni-tuebingen.de/tilman.berger

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

2008

2007

2006

2005

2004

2003

Re: [Wikide-l] Re: Konvertierung auf Unicode