Karl Eichwalder wrote:
Ich meine, dass man hier einen Unterschied zwischen Sprachen machen sollte, die sich der Lateinschrift bedienen, und solchen, für die das nicht gilt. Klar, statt oder neben Чехов kann ruhig die übliche deutsche Umschrift "Tschechow" stehen, und auf die sog. wissenschaftliche Transliteration "Čechov" kann man vielleicht ganz verzichten,
"Čehov" müßte es heißen, wenn ich das system richtig verstanden habe. ich würde nicht darauf verzichten, weil früher oder später jemand diese variante sowieso einfügen wird und weil selbstverständlich auch wissenschaftler den artikel finden sollten.
Nach dem in der deutschen Slavistik und den meisten deutschen Bibliotheken üblichen System heißt er "Čechov", es gibt aber auch Systeme, wo er "Čehov" geschrieben wird. In die deutsche Wikipedia gehört daher eher "Čechov".
wenn man die kyrillische Originalschreibung anführt. Aber wenn man aus "Lech Wałęsa" "Lech Walesa" macht oder aus "České Budějovice" "Ceske Budejovice",
es war ja meinerseits auch nicht die rede davon, einfach der 8. bit wegzuwerfen (leider wird das in der WP wohl des öfteren so gehandhabt ). es gibt bestimmt auch für polnisch und tschechisch diese regeln, die eine möglichst genaue abbildung mit ASCII (oder ISO-8859-1) erlauben. meinen namen schreiben die amerikaner zwar "richtig", aber die aussprache ist ihnen nicht so ohne weiteres klar. ich würde es durchaus akzeptieren, wenn sie meinen namen anders schrieben.
Solche Regeln gibt es nicht, höchstens als Privatkonvention von irgendwelchen Leuten.
Im Übrigen braucht man für die Zusatzzeichen zur Lateinschrift nicht einmal Unicode.
wie meinen? "Wałęsa" ist mit iso-8859-1 nicht angedeckt. es bleibt also nur, ein dateiformat wie HTML zunehmen und entities zu verwenden oder eine dateikodierung, bei der man mehrere encodings mischen kann (emacs-mule, iso 2022: http://en.wikipedia.org/wiki/ISO_2022 ). ich glaube aber kaum, daß wir encodings mischen wollen und wir wollen bestimmt auch nicht ein paar artikel in iso-8859-2 und den rest in iso-8859-1 haben wollen. also brauchen wir Unicode und als kodierung UTF-8.
Mit "iso-8859-1" ist es nicht abgedeckt, da braucht man schon "iso-8859-2" (was bei Mozilla übrigens als Central European beeichnet wird). Aber wenn die ganze Enzyklopädie in "iso-8859-1" wäre, fände ich das eh nicht toll. Gegen die Unicode-Version habe ich im Übrigen auch nichts, da ginge ja alles das, was ich für sinnvoll halte (und noch einiges mehr...).
Gruß
Tilman