On 23/Apr/2004 19:35:12, Agon S. Buchholz wrote:
Alwin Meschede wrote:
[ Konvertierung auf Unicode ]
Zum Einen ist die Diskussion wohl noch nicht durch bzw. es gibt Browser-technische Bedenken, zum Anderen hakt es auch technisch noch mit der Unicode-Umstellung.
Habt ihr mal Erfahrungen ausgetauscht mit den Wikipedias, die schon auf Unicode umgestellt haben?
Hallo,
bis jetzt gab es IMHO kaum Erfahrungsaustausch. Liegt wohl daran, das viele Leute (ich auch, wenn man von Latein absieht) nur deutsch und englisch sprechen. Und diese beiden haben noch nicht umgestellt.
Ich sehe außerdem auch noch ein Problem mit den Benutzergewohnheiten. Auf der Tabelle haben viele Leute ein gelbes Feld eingetragen und dazu geschrieben: "Geht, wenn man das und das macht z.B. den Zeichensatz ändert)". Das ist nach meiner Meinung zumindest problematisch. Eigendlich müssten die Felder rot sein. Kein DAU (ist jetzt nicht negativ gemeint)würde auf die Idee kommen, den Zeichensatz zu ändern. Ich sehe die ganzen Eintragungen auf "Ich brauche Hilfe" schon vor mir: "Die Seite wird nict korrekt dargestellt alle Umlaute/griechischen Zeichen/etc. sind weg/nicht zu sehen". Und das wird öffter kommen als wir uns das jetzt vorstellen, sogar wenn wir's in die FAQ schreiben. Unsere Stärke ist doch IMHO das wir der Bearbeitung möglichst wenig Hürden in den Weg stellen: Keine Anmeldung nötig/Browserunabhängigkeit/Relative leichte Syntax/Vorschau usw. Wenn wir jetzt aber verlangen, dass der User entweder einen modernen Browser benutzt oder Einstellungen in ihn verändert oder sogar das Betriebsystem wechseln soll (wie ich mitgekriegt habe, treten die meisten Probleme unter Linux auf), verlassen wir den Weg des möglichst Einfachen. Ich persönlich könnte einer Kovertierung nur zustimmen, wenn sicher ist, das wir keine Leser bzw. Autoren damit verscheuchen. Dies trifft entwerde dann zu, wenn alle üblichen Browser Unicode können (was z.Z. nicht der Fall ist) oder wenn wir diese Ersetzungsfunktion benutzen, wie si auf der Unicodedisku-Seite steht. Allerdings müsste auch das erst programmiert werden und es gibt keinerlei Erfahrungen, ob es wirklich immer funktioniert. Aus obrigen Argumenten ist zu ersehen, dass momentan viel mehr geben eine Umstellung spricht als dafür. Meiner Meinung nach wäre die Vorteile auch gar nicht so groß. Nur relativ wenig Leute könne Arabisch, chinesich oder russisch. Nur für diese Leute sind Worte mit Unicodezeichen interresant. Alle anderen (inklusive mich) verwirrt es nur, wenn mitten im Text Fragzeichen oder Rechtecke stehen, weil der Browser/das Betriebssystem das Zeichen nicht kennt/nicht darstellen kann, weil der falsche Schriftsatz eingestellt ist. Das soll jetzt nicht heissen, dass ich komplett gegen Unicode bin. Ich halte die Entwicklung für gut. Allerdings bin ich dagegen, jetzt bereists auf Unicode umzustellen. Ich denke Anfang 2006 wäre ein guter Termin mal wieder die Disku. ins Auge zu fassen. Bis dahin sollten auch Erfahrungen der kleineren Wikis vorliegen. Meist ist es nämlich so, dass Probleme erst nach einer Zeit auftreten, wenn die Euphorie sich gelegt hat. Sorry das ich soviel geschrieben habe( und für die Rechtschreibfehle auch). Allerdings liegt mir das Thema am Herzen.
Mit freundlichen Grüssen DaB.
Für eventuelle weitere Tests des Konvertierungsskripts stehe ich auf Nachfrage zur Verfügung (Installation unter Debian GNU/Linux Sid mit einem Dual Athlon MP).
MfG -asb
WikiDE-l mailing list WikiDE-l@Wikipedia.org <A HREF="http://mail.wikipedia.org/mailman/listinfo/wikide-l
">http://mail.wikipedia.org/mailman/listinfo/wikide-l
</A>
[ Subject angepaßt ]
Daniel wrote:
Kein DAU (ist jetzt nicht negativ gemeint) würde auf die Idee kommen, den Zeichensatz zu ändern.
Gut möglich. Auch das ließe sich aber durch einen Erfahrungsaustausch mit den Unicode-Wikipedias konkretisieren. Mir sind in letzter Zeit jedenfalls viele Websites aus dem wissenschaftlichen Bereich untergekommen, die Unicode voraussetzen. Da stellt sich dann aber wieder die Frage unseres Anspruchs und Selbstverständnisses, das wir auch bei der Diskussion um die Zulässigkeit von Großzitaten nicht klären konnten: Wollen wir wissenschaftlich, wissenschaftsnah (was auch immer das sein könnte) oder einfach nur populär sein?
Allerdings bin ich dagegen, jetzt bereists auf Unicode umzustellen. Ich denke Anfang 2006 wäre ein guter Termin mal wieder die Disku.
Die Frage ist allerdings, ob wir dann noch eine Datenbank haben, bei der überhaupt noch realistische Erfolgsaussichten zum erfolgreichen Konvertieren bestehen, wenn das jetzt schon bei 270 MB hakt (dann dürfte die Datenbankdateigröße irgendwo im Gigabytebereich liegen)...
MfG -asb
Es ist bei jeder Umstellung die gleiche Frage, je später man es macht, um so mehr Erfahrungen kann man zwar dabei nutzen, doch es wird auch immer schwieriger - eben zum Beispiel wegen des Volumens!
Ich denke, die anderen Sprachräume machen es uns vor und wir sollten nicht all zu stark hinterher hinken, durch die Verlagerung der Interessen auf Osteuropa und die große weite Weilt werden immer mehr Artikelnamen mit Diakritik auftauchen und das gibt mehr Probleme, Nis und NiÅ¡ bzw. [[Niš]] und [[NiÅ¡]] sind nur ein Beispiel! Ilja
----- Original Message ----- From: "Agon S. Buchholz" asb@kefk.net To: "Mailingliste der deutschsprachigen Wikipedia" wikide-l@Wikipedia.org Sent: Saturday, April 24, 2004 12:19 AM Subject: [Wikide-l] Konvertierung auf Unicode
[ Subject angepaßt ]
Daniel wrote:
Kein DAU (ist jetzt nicht negativ gemeint) würde auf die Idee kommen, den Zeichensatz zu ändern.
Gut möglich. Auch das ließe sich aber durch einen Erfahrungsaustausch mit den Unicode-Wikipedias konkretisieren. Mir sind in letzter Zeit jedenfalls viele Websites aus dem wissenschaftlichen Bereich untergekommen, die Unicode voraussetzen. Da stellt sich dann aber wieder die Frage unseres Anspruchs und Selbstverständnisses, das wir auch bei der Diskussion um die Zulässigkeit von Großzitaten nicht klären konnten: Wollen wir wissenschaftlich, wissenschaftsnah (was auch immer das sein könnte) oder einfach nur populär sein?
Allerdings bin ich dagegen, jetzt bereists auf Unicode umzustellen. Ich denke Anfang 2006 wäre ein guter Termin mal wieder die Disku.
Die Frage ist allerdings, ob wir dann noch eine Datenbank haben, bei der überhaupt noch realistische Erfolgsaussichten zum erfolgreichen Konvertieren bestehen, wenn das jetzt schon bei 270 MB hakt (dann dürfte die Datenbankdateigröße irgendwo im Gigabytebereich liegen)...
MfG -asb
WikiDE-l mailing list WikiDE-l@Wikipedia.org http://mail.wikipedia.org/mailman/listinfo/wikide-l
"Ilja Lorek" ilja.lorek@gmx.net writes:
Ich denke, die anderen Sprachräume machen es uns vor und wir sollten nicht all zu stark hinterher hinken,
ich bin zwar auch sehr für UTF-8, aber...
durch die Verlagerung der Interessen auf Osteuropa und die große weite Weilt werden immer mehr Artikelnamen mit Diakritik auftauchen und das gibt mehr Probleme, Nis und NiÅ¡ bzw. [[Niš]] und [[NiÅ¡]] sind nur ein Beispiel!
...es ist ziemlicher unsinn, nun alles mit häkchen und strichelchen schreiben zu wollen. wir sollten hier transkribieren und keineswegs transliterieren (vgl. duden). Wwir sollten hier "Tschechow" (transkription) schreiben, und nicht "Čehov" (transliteration, die nur von experten richtig ausgesprochen werden kann). "Čehov" oder gar die cyrillische variante sollte nur am anfang eines artikels zusammen mit der aussprache (['tʃɛxɔf]).
[mit dem neuesten Emacs aus dem CVS eingegeben, mal schauen...]
Ziemlicher Unsinn?
- es geht doch gar nicht um russischen Namen! Am aller wenigsten um die!
Schau doch in die Wikipedia, serbische Geschichte, da kommt noch was auf uns zu, natürlich kann man auch die Augen schliessen und ab durch den Gartentor... ,
doch ist es sinnvoll und wünschenswert? Und auf die Dauer ist dann ein Blechschaden unvermeidbar.
Ilja
----- Original Message ----- From: "Karl Eichwalder" ke@gnu.franken.de To: wikide-l@wikipedia.org Sent: Saturday, April 24, 2004 11:53 AM Subject: [Wikide-l] Re: Konvertierung auf Unicode
"Ilja Lorek" ilja.lorek@gmx.net writes:
Ich denke, die anderen Sprachräume machen es uns vor und wir sollten nicht all zu stark hinterher hinken,
ich bin zwar auch sehr für UTF-8, aber...
durch die Verlagerung der Interessen auf Osteuropa und die große weite Weilt werden immer mehr Artikelnamen mit Diakritik auftauchen und das gibt mehr Probleme, Nis und NiÅ¡ bzw. [[Niš]] und [[NiÅ¡]] sind nur ein Beispiel!
...es ist ziemlicher unsinn, nun alles mit häkchen und strichelchen schreiben zu wollen. wir sollten hier transkribieren und keineswegs transliterieren (vgl. duden). Wwir sollten hier "Tschechow" (transkription) schreiben, und nicht "Čehov" (transliteration, die nur von experten richtig ausgesprochen werden kann). "Čehov" oder gar die cyrillische variante sollte nur am anfang eines artikels zusammen mit der aussprache (['tʃɛxɔf]).
[mit dem neuesten Emacs aus dem CVS eingegeben, mal schauen...]
"Ilja Lorek" ilja.lorek@gmx.net writes:
Ziemlicher Unsinn?
danke.
- es geht doch gar nicht um russischen Namen!
es ist doch völlig egal, welches schriftsystem man verwendet, um den unterschied zwischen transkribieren und transliterieren deutlich zu machen. natürlich müssen wir auch serbische, tschechische oder polnische, ja auch dänische oder schwedische namen transkribieren - ich weiß oftmals jedenfalls nicht wie diese "å" oder "ø" auszusprechen sind.
eigentlich gilt das sogar für die vom lateinischen abgeleiteten sprachen, wenngleich mir die relativ nahe sind...
so, und nun poste bitte ein serbisches beispiel, damit wir sehen, um was es dir geht.
Auf Dein Wunsch:
in diesem Artikel wimmelt es nur von potentielen Stolpersteinen: http://de.wikipedia.org/wiki/Geschichte_Serbiens
Zitat: Bis ins 9. Jahrhundert lebten die Serben unter nominaler Oberherrschaft des byzantinischen Reiches und in relativ friedlicher Nachbarschaft mit den Bulgaren. Der oberste Mann im Staat war der so genannte Groß-?upan, der von den anderen ?upans als Anführer anerkannt wurde.
830 schlossen sich die in loser Nachbarschaft lebenden Stämme unter ?upan Vlastimir zu einem staatenähnlichen Gebilde zusammen, um sich gegen die nun unter Khan Presiam gegen Byzanz vordrängenden Bulgaren wehren zu können.
Unter Vlastimir und seinen Nachfolgern wurde Serbien (Raszien) in der 2. Hälfte des 9. Jahrhunderts wahrscheinlich unter direktem Einfluss der "Slawenapostel" Kyrill und Method von Byzanz aus orthodox christianisiert.
Im Zuge der Auseinandersetzungen zwischen Bulgarien und Byzanz im 10. Jahrhundert war Serbien eher Byzanz zugeneigt. Um diese Gefahr auszuschalten, gab der bulgarische Zar Simeon I. vor, Časlav, einen am bulgarischen Hof aufgewachsenen Urenkel Vlastimirs als Groß-?upan einsetzen zu wollen. Dies war aber nur ein Vorwand, um Serbien als Provinz zu annektieren. Časlav wurde zusammen mit anderen ?upans gefangen genommen. Viele, die nicht schon vorher geflohen waren, flohen nach Griechenland oder Kroatien.
Nach Simeons Tod 927 kehrte Časlav als Befreier nach Serbien zurück. Er erkannte Byzanz als oberste Autorität an und bekam dafür Hilfe beim Wiederaufbau des Landes. Unter Časlav bekam der Staat, der etwas größer war als unter Vlastimir, wieder inneren Zusammenhalt. Nach seinem Tod bei einem Angriff der Ungarn zerfiel er aber wieder.
Zitatende.
Da sollen ev. noch Artikelnamen wie [[Časlav]] entstehen und so weiter, Du - nicht ich - bezeichnest DAS als Unsinn. Es ist schon schwierig den Benutzern und Autoren zu erklären, warum das eine diakritische Zeichen im Artikelname möglich sein sollte und das andere nicht, ich habe mich daran schon längst gewöhnt, doch ich denke, warum sollte die Zukunftsenzyklopädie Wikipedia nicht auch die Zukunftstechnologie anwenden, besser gesagt, warum sollte die wikipedia.de nicht das anwenden, was wikipedia.cz uns wikipedia.fr schon können.
Mag sein, dass ich schrecklich konservativ bin, aber die Schreibweise wie "für Abkürzungen" macht mich irgendwie nicht glücklich. ich will es nicht überbewerten, wenn ich heute in einem deutschsprachigen Werk aus den letzten Jahren hineinschaue, stimmt die Diakritik nur sehr selten, wenigstens dort, wo ich es mit meinen abgemagerten Sprachkenntnissen beurteilen kann, es wird zwar immer bißchen besser, aber auch die großen Verlagen scheinen das immer noch nicht voll im Griff zu haben, die US-amerikanischen und englischen Verlage sind dagegen schon ein ganz trauriges Kapitel, bei denen stimmen oft nicht einmal die deutschen Städtenamen. Andere Provenienzen lassen wir aus reiner Höflichkeit hier beiseite. Doch Himmel-Herr-Gott, gerade DAS wünsche ich mir von der Wikipedia, das wir hier, als ein multinationales Zusammenarbeitsteam SO WAS besser machen. Denn wir haben dazu die Werkzeuge und die Mitarbeiter (uns), also warum nicht? Wer denn sonst, wenn nicht wir?
Und Leute aus Serbien, Polen, Norwegen oder Böhmen werden sich freuen, dass sie das in der Wikipedia wiederfinden, was sie sonst so oft vermissen müssen. Wenn einer zum Beispiel "Časlav" heißt, kannst Du Dir vorstellen, was es ihm bedeutet, wenn er immer wieder Caslav, Kaslaf oder sonst genannt wird, wenn er immer wieder "Tschaslaw" oder "Chaslaff" angeschrieben geschrieben wird. Unicode ist eine Chance, man mag darüber lachen, aber vielleicht auch ein kleiner Beitrag zum Frieden, wie der ASCI-Code ein Kind des kalten Krieges war, wenigstens in der ersten 7-Bit-Version.
Genug zum Thema, Ende der Durchsage! Nächstes Mal zu den noch sonderbareren Artikelnamen in der Wikipedia, aber das ist schon wieder eine andere Baustelle.
Gruß Ilja
----- Original Message ----- From: "Karl Eichwalder" ke@gnu.franken.de To: wikide-l@wikipedia.org Sent: Saturday, April 24, 2004 2:12 PM Subject: [Wikide-l] Re: Konvertierung auf Unicode
"Ilja Lorek" ilja.lorek@gmx.net writes:
Ziemlicher Unsinn?
danke.
- es geht doch gar nicht um russischen Namen!
es ist doch völlig egal, welches schriftsystem man verwendet, um den unterschied zwischen transkribieren und transliterieren deutlich zu machen. natürlich müssen wir auch serbische, tschechische oder polnische, ja auch dänische oder schwedische namen transkribieren - ich weiß oftmals jedenfalls nicht wie diese "å" oder "ø" auszusprechen sind.
eigentlich gilt das sogar für die vom lateinischen abgeleiteten sprachen, wenngleich mir die relativ nahe sind...
so, und nun poste bitte ein serbisches beispiel, damit wir sehen, um was es dir geht.
"Ilja Lorek" ilja.lorek@gmx.net writes:
Da sollen ev. noch Artikelnamen wie [[Časlav]] entstehen und so weiter, Du - nicht ich - bezeichnest DAS als Unsinn.
mir persönlich ist es im grunde schnuppe. der durchschnittsdeutsche wird nur schlicht nicht wissen (da schließe ich mich ein), wie man so näherungsweise aussprechen soll. da wir russische namen transkribieren, sollten wir auch mitteleuropäische namen transkribieren. aber wenn die mehrheitmeinung ist, zeichen wie ł und ė und ę und ő und ă etc. sind zumutbar, dann will ich mich nicht streuben. allerdings sollten die dann auch in artikelnamen erlaubt sein. möglicherweise sind wir deutschen ja schon mitteleuropäischer als ich bisweilen glaube.
Mag sein, dass ich schrecklich konservativ bin, aber die Schreibweise wie "für Abkürzungen" macht mich irgendwie nicht glücklich.
von mail- und newsreadern kann man mittelweile eine unterstützung von UTF-8 erwarten. einfach einen solchen installieren. ich verwende jedenfalls nur noch UTF-8, alle alt-dokumente werde ich nach und nach konvertieren.
ich will es nicht überbewerten, wenn ich heute in einem deutschsprachigen Werk aus den letzten Jahren hineinschaue, stimmt die Diakritik nur sehr selten, wenigstens dort, wo ich es mit meinen abgemagerten Sprachkenntnissen beurteilen kann, es wird zwar immer bißchen besser, aber auch die großen Verlagen scheinen das immer noch nicht voll im Griff zu haben, die US-amerikanischen und englischen Verlage sind dagegen schon ein ganz trauriges Kapitel, bei denen stimmen oft nicht einmal die deutschen Städtenamen.
das kann man so nicht sagen. es ist einfach üblich, daß städtenamen übersetzt werden (Munich, Nuremberg) und kleine städte werden entweder entsprechend behandelt oder transkribiert.
Andere Provenienzen lassen wir aus reiner Höflichkeit hier beiseite. Doch Himmel-Herr-Gott, gerade DAS wünsche ich mir von der Wikipedia, das wir hier, als ein multinationales Zusammenarbeitsteam SO WAS besser machen. Denn wir haben dazu die Werkzeuge und die Mitarbeiter (uns), also warum nicht? Wer denn sonst, wenn nicht wir?
ich denke da wahrscheinlich zu leser-orientiert.
Und Leute aus Serbien, Polen, Norwegen oder Böhmen werden sich freuen, dass sie das in der Wikipedia wiederfinden, was sie sonst so oft vermissen müssen. Wenn einer zum Beispiel "Časlav" heißt, kannst Du Dir vorstellen, was es ihm bedeutet, wenn er immer wieder Caslav, Kaslaf oder sonst genannt wird, wenn er immer wieder "Tschaslaw" oder "Chaslaff" angeschrieben geschrieben wird.
das ist einfach so. du kannst nicht erwarten, daß man fremde systeme kann. dafür gibt es die transkriptionssysteme. es ist ein falscher ansatz, in der de-WP so zu schreiben, daß sich in erster linie die sprachfremden dort zurechtfinden. du scheinst, was namen betrifft, ein optischer typ zu sein, ich bin da eher akustisch ausgerichtet.
Unicode ist eine Chance, man mag darüber lachen, aber vielleicht auch ein kleiner Beitrag zum Frieden, wie der ASCI-Code ein Kind des kalten Krieges war, wenigstens in der ersten 7-Bit-Version.
ich habe gar nichts gegen unicode (in UTF-8-kodierung); das problem ist dann nur, daß ich meinem kollegen nicht mehr _sagen_ kann, "XYZ hat das und das gemacht" - zur verständigung muß ich dann den namen schreiben. geht natürlich auch. alles richtig geschrieben und keiner versteht es mehr: babylonische schriftverwirrung.
Oder, um es konkret zu machen: zu mancher mittel- oder osteuropäischen stadt würde ich wohl etwas scheiben wollen; wenn ich jedoch bei den "Letzen Änderungen" nur eine aneinandereihung "komischer" buchstaben sehe, fühle ich mich nicht angesprochen - das ist kein böser wille, sondern schlichte unwissenheit.
und zu recht fordern dann auch die arabisten, daß man gefälligst all die häkchen zu verstehen hat.
ich wußte es ja schon immer, die WP wird für die autoren gemacht :)
Zitat: ich wußte es ja schon immer, die WP wird für die autoren gemacht :)
da hast Du definitiv recht, aber das muss doch nicht so laut sagen! ;~}
Gruss Ilja
----- Original Message ----- From: "Karl Eichwalder" ke@gnu.franken.de To: wikide-l@wikipedia.org Sent: Saturday, April 24, 2004 11:20 PM Subject: [Wikide-l] Re: Konvertierung auf Unicode
Karl Eichwalder wrote:
...es ist ziemlicher unsinn, nun alles mit häkchen und strichelchen schreiben zu wollen. wir sollten hier transkribieren und keineswegs transliterieren (vgl. duden). Wwir sollten hier "Tschechow" (transkription) schreiben, und nicht "Čehov" (transliteration, die nur von experten richtig ausgesprochen werden kann). "Čehov" oder gar die cyrillische variante sollte nur am anfang eines artikels zusammen mit der aussprache (['tʃɛxɔf]).
Ich meine, dass man hier einen Unterschied zwischen Sprachen machen sollte, die sich der Lateinschrift bedienen, und solchen, für die das nicht gilt. Klar, statt oder neben Чехов kann ruhig die übliche deutsche Umschrift "Tschechow" stehen, und auf die sog. wissenschaftliche Transliteration "Čechov" kann man vielleicht ganz verzichten, wenn man die kyrillische Originalschreibung anführt. Aber wenn man aus "Lech Wałęsa" "Lech Walesa" macht oder aus "České Budějovice" "Ceske Budejovice", dann empfinde ich das als kulturlos (und ahne, dass die Leute, um deren Sprache es geht, das ähnlich sehen). Wir wollen ja auch nicht, dass andere in deutschen Wörtern einfach die Umlautzeichen weglassen o.Ä. Im Übrigen braucht man für die Zusatzzeichen zur Lateinschrift nicht einmal Unicode.
Gruß
Tilman
Tilman Berger tilman_berger@web.de writes:
Ich meine, dass man hier einen Unterschied zwischen Sprachen machen sollte, die sich der Lateinschrift bedienen, und solchen, für die das nicht gilt. Klar, statt oder neben Чехов kann ruhig die übliche deutsche Umschrift "Tschechow" stehen, und auf die sog. wissenschaftliche Transliteration "Čechov" kann man vielleicht ganz verzichten,
"Čehov" müßte es heißen, wenn ich das system richtig verstanden habe. ich würde nicht darauf verzichten, weil früher oder später jemand diese variante sowieso einfügen wird und weil selbstverständlich auch wissenschaftler den artikel finden sollten.
wenn man die kyrillische Originalschreibung anführt. Aber wenn man aus "Lech Wałęsa" "Lech Walesa" macht oder aus "České Budějovice" "Ceske Budejovice",
es war ja meinerseits auch nicht die rede davon, einfach der 8. bit wegzuwerfen (leider wird das in der WP wohl des öfteren so gehandhabt :-( ). es gibt bestimmt auch für polnisch und tschechisch diese regeln, die eine möglichst genaue abbildung mit ASCII (oder ISO-8859-1) erlauben. meinen namen schreiben die amerikaner zwar "richtig", aber die aussprache ist ihnen nicht so ohne weiteres klar. ich würde es durchaus akzeptieren, wenn sie meinen namen anders schrieben.
dann empfinde ich das als kulturlos (und ahne, dass die Leute, um deren Sprache es geht, das ähnlich sehen). Wir wollen ja auch nicht, dass andere in deutschen Wörtern einfach die Umlautzeichen weglassen o.Ä.
ja, aber anstelle von "grüß gott" akzeptieren wir "gruess gott".
Im Übrigen braucht man für die Zusatzzeichen zur Lateinschrift nicht einmal Unicode.
wie meinen? "Wałęsa" ist mit iso-8859-1 nicht angedeckt. es bleibt also nur, ein dateiformat wie HTML zunehmen und entities zu verwenden oder eine dateikodierung, bei der man mehrere encodings mischen kann (emacs-mule, iso 2022: http://en.wikipedia.org/wiki/ISO_2022 ). ich glaube aber kaum, daß wir encodings mischen wollen und wir wollen bestimmt auch nicht ein paar artikel in iso-8859-2 und den rest in iso-8859-1 haben wollen. also brauchen wir Unicode und als kodierung UTF-8.
Karl Eichwalder wrote:
Ich meine, dass man hier einen Unterschied zwischen Sprachen machen sollte, die sich der Lateinschrift bedienen, und solchen, für die das nicht gilt. Klar, statt oder neben Чехов kann ruhig die übliche deutsche Umschrift "Tschechow" stehen, und auf die sog. wissenschaftliche Transliteration "Čechov" kann man vielleicht ganz verzichten,
"Čehov" müßte es heißen, wenn ich das system richtig verstanden habe. ich würde nicht darauf verzichten, weil früher oder später jemand diese variante sowieso einfügen wird und weil selbstverständlich auch wissenschaftler den artikel finden sollten.
Nach dem in der deutschen Slavistik und den meisten deutschen Bibliotheken üblichen System heißt er "Čechov", es gibt aber auch Systeme, wo er "Čehov" geschrieben wird. In die deutsche Wikipedia gehört daher eher "Čechov".
wenn man die kyrillische Originalschreibung anführt. Aber wenn man aus "Lech Wałęsa" "Lech Walesa" macht oder aus "České Budějovice" "Ceske Budejovice",
es war ja meinerseits auch nicht die rede davon, einfach der 8. bit wegzuwerfen (leider wird das in der WP wohl des öfteren so gehandhabt ). es gibt bestimmt auch für polnisch und tschechisch diese regeln, die eine möglichst genaue abbildung mit ASCII (oder ISO-8859-1) erlauben. meinen namen schreiben die amerikaner zwar "richtig", aber die aussprache ist ihnen nicht so ohne weiteres klar. ich würde es durchaus akzeptieren, wenn sie meinen namen anders schrieben.
Solche Regeln gibt es nicht, höchstens als Privatkonvention von irgendwelchen Leuten.
Im Übrigen braucht man für die Zusatzzeichen zur Lateinschrift nicht einmal Unicode.
wie meinen? "Wałęsa" ist mit iso-8859-1 nicht angedeckt. es bleibt also nur, ein dateiformat wie HTML zunehmen und entities zu verwenden oder eine dateikodierung, bei der man mehrere encodings mischen kann (emacs-mule, iso 2022: http://en.wikipedia.org/wiki/ISO_2022 ). ich glaube aber kaum, daß wir encodings mischen wollen und wir wollen bestimmt auch nicht ein paar artikel in iso-8859-2 und den rest in iso-8859-1 haben wollen. also brauchen wir Unicode und als kodierung UTF-8.
Mit "iso-8859-1" ist es nicht abgedeckt, da braucht man schon "iso-8859-2" (was bei Mozilla übrigens als Central European beeichnet wird). Aber wenn die ganze Enzyklopädie in "iso-8859-1" wäre, fände ich das eh nicht toll. Gegen die Unicode-Version habe ich im Übrigen auch nichts, da ginge ja alles das, was ich für sinnvoll halte (und noch einiges mehr...).
Gruß
Tilman
Karl Eichwalder wrote:
wir sollten hier transkribieren und keineswegs transliterieren (vgl. duden). Wwir sollten hier "Tschechow" (transkription) schreiben, und nicht "Čehov" (transliteration, die nur von experten richtig ausgesprochen werden kann).
Ich freue mich schon auf den Artikel zum Thema "Lodsch"! :-)
Timwi timwi@gmx.net writes:
Ich freue mich schon auf den Artikel zum Thema "Lodsch"! :-)
lt. duden ist die schreibweise "Lodsch" gültig; eingesehen habe ich die 16. (1967) und 21. auflage (1996). zugegeben, das überrascht selbst mich.
Hallo Timwi,
Am Saturday, April 24, 2004, 11:40:11 PM, haben Sie / hast du geschrieben:
Ich freue mich schon auf den Artikel zum Thema "Lodsch"! :-)
die strammen Deutschen sag(t)en zu dieser Stadt übrigens Litzmannstadt.
On Fri, Apr 23, 2004 at 11:43:47PM +0200, Daniel wrote:
...
Ich sage: Lieber gestern als heute. Unicode wird der neue Standard werden, und sowas tut IMMER weh. Wenn 95% der Autoren und 90% der Leser keine Fehler bei der Darstellung haben dann ist das für mich zu verkraften. Bei den Browsern wo wir wissen dass es Darstellungsprobleme gibt kann man ja einen Meldung drüber schreiben.
Sorry das ich soviel geschrieben habe( und für die Rechtschreibfehle auch). Allerdings liegt mir das Thema am Herzen.
Gewöhn dir lieber an keine Zeilen länger als 70 Zeichen zu machen.
ciao, tom