From: OTA Takashi takot+wikija@sfc.keio.ac.jp Reply-To: Mailinglist of Japanese Wikipedia wikija-l@Wikipedia.org To: Mailinglist of Japanese Wikipedia wikija-l@Wikipedia.org Subject: Re: [WikiJA-l] How to read this message? Date: Sun, 19 Mar 2006 19:29:04 +0900
At 2006/03/19 19:12:12 Sushisushi Swedenborg wrote:
以下のような文字化けメールが送られてきました。これでは、指示に従いようが
ありません。
MediaWiki は UTF-8 使ってますし,これは UTF-8 で送られてきてるっぽいですね . 私も UTF-8 のメール読めないし,日本語のメールを送るときには ISO-2022-JP に ちゃんとコンバートしてから送ってほしいところですね.
--OTA Takashi
OTA Takashiさん、お返事ありがとうございます。 ISO-2022-JPとまで言わずとも、やはり日本語の文章は、SHIFT_JISか日本語EUCで必 ず読めるようにしておいて欲しいと思いますよね。
UTF-8(Unicode)主体のブログ(GoogleのBlogger)や外国からのメールでの経験から 言うと、問題の文字化けメールの原因は、文字コードがUTF-8だからではないと私は 思います。つまり、純粋な、加工や脱落のないUTF-8であれば、日本語環境でも文字 コードの選択だけで読めるはずだからです。これと極めてそっくりな文字化けメール がありました。RealNetworksからパスワードを送信してもらったときのことです。原 因は、中国大陸から送信されているため、だそうです。
日本語版ウィキペディアのサーバーは、一体どういう訳で韓国にあるんでしょうか?
Suisuiさんは韓国に住んでいて、東京都中野区在住(?)の「今泉誠」(あらたなペ ンネーム?)さんは、実は同一人物ではない、ということなのでしょうか。
_________________________________________________________________ 迷惑メールやウイルスへの対策も万全「MSN Hotmail」 http://promotion.msn.co.jp/hotmail/
Sketchです。私のところには、次のような内容で届いていました。
---- どなたか(IPアドレス ---.---.---.--- の使用者)がこのメールアドレスを使 用して Wikipedia にアカウント "------" を登録しました。
このアカウントが本当にあなたのものであるか確認し、 Wikipedia のメール通知機能を有効にするために以下のURLにアクセスしてくだ さい: http://ja.wikipedia.org/wiki/%E7%89%B9%E5%88%A5:Confirmemail/----------
もし Wikipedia について身に覚えがない場合は、リンクを開かないでください。 確認用コードは ----年--月--日 (-) --:-- に期限切れになります。
-- Wikipedia メールアドレス確認システム http://ja.wikipedia.org/ ----
これは単純にメールを処理するソフトがUTF-8を理解できるかどうかの問題で、 私の環境(JustsystemのShuriken Pro 4/R2を使っています)では上記のように 問題なく表示できています。
ISO-2022-JPとまで言わずとも、やはり日本語の文章は、SHIFT_JISか日本語
EUCで必
ず読めるようにしておいて欲しいと思いますよね。
メールで日本語を利用するときはISO-2022-JPかUTF-8が一般的でしょう。EUC-JP やShiftJisを使ったメールは、RFCに則っていないのではないかと思います。
日本語版ウィキペディアのサーバーは、一体どういう訳で韓国にあるんでしょ
うか? 韓国にある23台のサーバは寄付を受けたものであるからです。 http://meta.wikimedia.org/wiki/%E3%82%A6%E3%82%A3%E3%82%AD%E3%83%A1%E3%83%87... に少しだけ説明があります。
=============================================================== Sketch at ja.wikipedia http://ja.wikipedia.org/wiki/%E5%88%A9%E7%94%A8%E8%80%85:Sketch sketch @ wikipedia.club.ne.jp
# なぜ reply じゃなくて forward なんだろう……まあそれはさておき.
From: "Sushisushi Swedenborg" emmanuel_swedenborg555@msn.com Subject: [WikiJA-l] FW: Re: How to read this message? Date: Sun, 19 Mar 2006 12:16:32 +0000
OTA Takashiさん、お返事ありがとうございます。ISO-2022-JPとまで言わず とも、やはり日本語の文章は、SHIFT_JISか日本語EUCで必ず読めるようにし ておいて欲しいと思いますよね。
いや,ISO-2022-JP です.
RFC 1468: Japanese Character Encoding for Internet Messages http://www.ietf.org/rfc/rfc1468.txt
では,
| Introduction | | This document describes the encoding used in electronic mail | [RFC822] and network news [RFC1036] messages in several Japanese | networks. It was first specified by and used in JUNET [JUNET]. The | encoding is now also widely used in Japanese IP communities.
であり,その他のエンコーディングを指してはいません.この RFC はインター ネット上で使われるべき「標準」を規定していませんので,インターネット上 での日本語の電子メールが ISO-2022-JP で流通「しなければならない」わけ ではありません.ですから特定の者の間で ISO-2022-JP 以外のエンコーディ ングで電子メールがやり取りされようとも,それについては特に問題はないと 思います.また 1993 年の RFC ですから,現在の状況との乖離があるとも言 えましょう. しかしながらこれを obsolete する RFC が出ていない以上,やはり事前に エンコーディング方式の同意のない日本語の電子メールを出す際(今回のケー スはこれに該当しますよね)には,ISO-2022-JP であるべきだと私は考えてい ます.ISO-2022-JP を扱えない電子メール環境は基本的にないですし(他のエ ンコーディングを扱えない環境はあるかもしれないけど),また RFC 1468 が Information として提供されている以上,MUA は最低限 ISO-2022-JP をサポー トして実装されるべきだとも思います.
# しかし Pocket Outlook は charset=iso-2022-jp 指定がない ISO-2022-JP # のメールが扱えないので,こっちは実装の方を何とかしてほしい…….
UTF-8(Unicode)主体のブログ(GoogleのBlogger)や外国からのメールでの 経験から言うと、問題の文字化けメールの原因は、文字コードがUTF-8だか らではないと私は思います。つまり、純粋な、加工や脱落のないUTF-8であ れば、日本語環境でも文字コードの選択だけで読めるはずだからです。
それは「文字コードの選択」ができる環境ならば……という話ですね.ウェブ ブラウザで UTF-8 をエンコーディングとして選択できる環境は増えてきまし たが,UTF-8 を扱えない電子メール環境はまだまだあります.いま私が読み書 きしている電子メール環境の一つもそうです.
これと極めてそっくりな文字化けメールがありました。RealNetworksからパ スワードを送信してもらったときのことです。原因は、中国大陸から送信さ れているため、だそうです。
それは原因を説明した人が間違ってるんじゃないでしょうかね.サーバがどこ の国に置いてあるかと,そのサーバがどういう言語を使うように設定されてい るかは,基本的に独立な問題ですし.アメリカに置いてある Google のサーバ はちゃんと日本語扱えますよね(もちろんアメリカ以外のいろんな国のもある けど).中国大陸に置いてあるサーバが適切に設定されていない可能性は,当 然あるでしょうけれども,しかしそういう説明をする方も適切ではないよう な…….
確かに MTA が 8bit 目を落とすとかどうとかいう話は今でもありますが(とい うのもどうかと思うけれど) http://search.luky.org/linux-users.a/msg05659.html
それは ISO-2022-JP を使えば問題がない話なので,やっぱりその意味からも UTF-8 で送ってくるべきではないと思います.
日本語版ウィキペディアのサーバーは、一体どういう訳で韓国にあるんでしょ うか?
どういう訳かは私は知りませんが,別に韓国にあっても適切に設定されていれ ばかまわないと思います.
---------- ニュースはみんなのために /|\ メールは個人のために ---------- 太田尚志 - http://web.sfc.keio.ac.jp/~takot/ MSN#: supertakot@hotmail.コム
Tietew です。
On Sun, 19 Mar 2006 22:18:50 +0900 In article 20060319221850R.takot@sfc.keio.ac.jp [Re: [WikiJA-l] How to read this message?] OTA Takashi takot+wikija@sfc.keio.ac.jp wrote:
# なぜ reply じゃなくて forward なんだろう……まあそれはさておき.
# たまに reply を知らない人がいます。返すメールが全部Fwっていう…
それは「文字コードの選択」ができる環境ならば……という話ですね.ウェブ ブラウザで UTF-8 をエンコーディングとして選択できる環境は増えてきまし
UTF-8に対応していないWebブラウザは既に過去のものでしょう。 Lynxだって対応しています。モバイルブラウザも対応しています。
もちろん,backward compatibility は大切ですから,過去のブラウザ でも読みたいという需用は理解できます。しかし,オープンプロジェク トなのですから,欲しい人が需要を満たすのが基本です。
たが,UTF-8 を扱えない電子メール環境はまだまだあります.いま私が読み書 きしている電子メール環境の一つもそうです.
あれ? Mew って対応してないんですか。 … 標準対応は Emcas 22 以降ですか。でもUCSパッケージ(?)を追加でイン ストールすれば読めるそうですよ。
それは ISO-2022-JP を使えば問題がない話なので,やっぱりその意味からも UTF-8 で送ってくるべきではないと思います.
ISO-2022-JP が現時点でベストであることは否定しません。しかし, UTF-8と「明示してある」メールをShift_JISだと強制的に解釈するよう なタコなWebメールシステムを救済すべきだともまた思いませんし,今 時charsetを付けずにISO-2022-JPを送るMUAも駆逐されて欲しいと思っ ています。
そういうWebメールシステムって,spamに多いGB2312とかEUC-KRとか もやっぱりShift_JISだと強制的に解釈するのでしょうか【ピュア】
そして,何より問題なのはMediaWikiは国際化アプリケーションである ということです。一体何を基準にしてISO-2022-JPで送ればよいのでしょ う。
Wikipediaに実装されていないので知る人は少ないのですが,MediaWiki にはウオッチリストのメール通知機能がありますが,ISO-2022-JPに無 い文字が使われたページの編集をどうやってISO-2022-JPで送信すれば よいのでしょう?
もちろん,今すぐに思いつかないだけで解決策はあるかもしれません。 別に全部否定しているわけではないので勘違いしないで下さい。
実装していないので存在を忘れる機能は多々あるのですが、 MediaWikiメッセージのL10nをやっていると 「これほしいな」と思うことはままありますね。Aphaiaです、ども。 #WLのメール報知は #今度Bugzillaで頼んでみようかな。。
そして,何より問題なのはMediaWikiは国際化アプリケーションである ということです。一体何を基準にしてISO-2022-JPで送ればよいのでしょ う。
これって、 どうせ通知メッセージは規定値に変数いれるだけなんだろうから #ということはLanguageXX.php に依存するだろうと予測 インタフェースの言語指定同様、「規定値ではXX、ただしユーザ 設定がなされた場合後者に従う」というのではだめなんかな。
WLのワッチメールも以下同文。
ところで以前にTietewさん主導でLanguageJA.phpを日本語化したときから大分時間もたち、 最近また日本語規定値のないメッセージが増えてきたなと感じます。 また日本語化祭りをやりませんか?>いづ方ともなく -- Aphaea@*.wikipedia.org email: Aphaia @ gmail (dot) com
Tietew です。
On Mon, 20 Mar 2006 15:10:55 +0900 In article 35be2a710603192210n3085211aie5fab13103a51e05@mail.gmail.com [Re: [WikiJA-l] How to read this message?] Aphaia aphaia@gmail.com wrote:
実装していないので存在を忘れる機能は多々あるのですが、 MediaWikiメッセージのL10nをやっていると 「これほしいな」と思うことはままありますね。Aphaiaです、ども。 #WLのメール報知は #今度Bugzillaで頼んでみようかな。。
多分メールが爆発してMTAが死ぬと思います…… 今でさえ zwinger がspamcopに登録されたって話があるくらいなので。 # spamと間違えられたらしい
ところで以前にTietewさん主導でLanguageJA.phpを日本語化したときから大分時間もたち、 最近また日本語規定値のないメッセージが増えてきたなと感じます。 また日本語化祭りをやりませんか?>いづ方ともなく
あー,まあ,一応TODOには入ってます: http://wikipedia.g.hatena.ne.jp/Tietew/
―[ Tietew ]―――――――――――――――――――――――――――― Mail: tietew@tietew.net / tietew@raug.net Web : http://www.tietew.net/ Tietew Windows Lab. PGP fingerprint: 26CB 71BB B595 09C4 0153 81C4 773C 963A D51B 8CAA
WikiBreak中のNJT@jawiktです。
本題は最後にあります。文章構成が悪くてすみません。
--- Tietew tietew-wikipedia@tietew.net さんからのメッセージ:
ISO-2022-JP が現時点でベストであることは否定しません。しかし, UTF-8と「明示してある」メールをShift_JISだと強制的に解釈するよう なタコなWebメールシステムを救済すべきだともまた思いませんし,今 時charsetを付けずにISO-2022-JPを送るMUAも駆逐されて欲しいと思っ ています。
そういうWebメールシステムって,spamに多いGB2312とかEUC-KRとか もやっぱりShift_JISだと強制的に解釈するのでしょうか【ピュア】
今、私のメールアドレスからおわかりのように、Yahoo!メールでWikiJA-l を読んでいるのですが、Yahoo!メールでもutf-8メールは化けてしまいま す。この環境でGBやEUC-KRがどう扱われるかはちょっとわかりません。
そして,何より問題なのはMediaWikiは国際化アプリケーションである ということです。一体何を基準にしてISO-2022-JPで送ればよいのでしょ う。
これについては、Webの環境とmailの環境が必ずしも一致しないことも 影響していますね。使われ方が違うために、メールについては日本語 と英語だけ表示できれば十分と考えている人が多いように思います。
Wikipediaに実装されていないので知る人は少ないのですが,MediaWiki にはウオッチリストのメール通知機能がありますが,ISO-2022-JPに無 い文字が使われたページの編集をどうやってISO-2022-JPで送信すれば よいのでしょう?
htmlの添付で。ウォッチリストの通知を望んでいるのに、Webブラウザが 使えないということはないでしょう。(冗談です。Webブラウザとは別の 環境でメールチェックしているかもしれませんから)
もちろん,今すぐに思いつかないだけで解決策はあるかもしれません。 別に全部否定しているわけではないので勘違いしないで下さい。
さて、本題ですが、私のようにWebはutf-8が読めても、メールは読めな い者はそれほど稀ではないかと思います。これについて、本件のような 通知メッセージの場合は、英語(ISO 646の範囲)で書かれたメッセージ が併記されているとほぼ救われると思います。 ただ、単純にテンプレートをつくると、動的に生成されるURLを2箇所 ずつ埋め込むことになるので、簡単純にできるかどうかわかりません が、以下のように参照させればよいように思います。 末尾のURL[1]にアクセスしてください。 ... Please access to the URL[1] at the end of this mail. ... [1] http://.......
いかがでしょうか。 -- NJT njt@yahoo.co.jp
Tietew です。
On Wed, 22 Mar 2006 06:40:30 +0900 (JST) In article 20060321214030.62165.qmail@web2006.mail.yahoo.co.jp [Re: [WikiJA-l] How to read this message?] NAKAZATO Takeshi njt@yahoo.co.jp wrote:
そういうWebメールシステムって,spamに多いGB2312とかEUC-KRとか もやっぱりShift_JISだと強制的に解釈するのでしょうか【ピュア】
今、私のメールアドレスからおわかりのように、Yahoo!メールでWikiJA-l を読んでいるのですが、Yahoo!メールでもutf-8メールは化けてしまいま す。この環境でGBやEUC-KRがどう扱われるかはちょっとわかりません。
ちょうど一昨日のAphaiaさんのメール(一通目)がGB2312です。 これについては純粋な疑問ですのでよろしければどのように見えるのか 教えて頂けますか。
これについては、Webの環境とmailの環境が必ずしも一致しないことも 影響していますね。使われ方が違うために、メールについては日本語 と英語だけ表示できれば十分と考えている人が多いように思います。
というか日本の大多数のWebメールが未だにUTF-8で書かれた「日本語」 を読むことすらできないというのもかなり驚きです。ちなみに,Yahoo 本家 (yahoo.com) はUTF-8を扱えるそうです。
さて、本題ですが、私のようにWebはutf-8が読めても、メールは読めな い者はそれほど稀ではないかと思います。これについて、本件のような 通知メッセージの場合は、英語(ISO 646の範囲)で書かれたメッセージ が併記されているとほぼ救われると思います。
多分,ああいう人たちは英語表記してあっても「読めない」とのたまい ます。
NJTです。
--- Tietew tietew-wikipedia@tietew.net さんのメッセージ:
そういうWebメールシステムって,spamに多いGB2312とかEUC-KRとか もやっぱりShift_JISだと強制的に解釈するのでしょうか【ピュア】
今、私のメールアドレスからおわかりのように、Yahoo!メールでWikiJA-l を読んでいるのですが、Yahoo!メールでもutf-8メールは化けてしまいま す。この環境でGBやEUC-KRがどう扱われるかはちょっとわかりません。
ちょうど一昨日のAphaiaさんのメール(一通目)がGB2312です。 これについては純粋な疑問ですのでよろしければどのように見えるのか 教えて頂けますか。
表示されているhtml一式をこのメールに添付しました。 関心のある方はどうぞ。
これについては、Webの環境とmailの環境が必ずしも一致しないことも 影響していますね。使われ方が違うために、メールについては日本語 と英語だけ表示できれば十分と考えている人が多いように思います。
というか日本の大多数のWebメールが未だにUTF-8で書かれた「日本語」 を読むことすらできないというのもかなり驚きです。ちなみに,Yahoo 本家 (yahoo.com) はUTF-8を扱えるそうです。
yahoo.com では読めるというのは存じませんでした。 なぜutf-8対応しないのか不思議ですが、ISO-2022-JPをデフォルトとするのと、 utf-8対応の両立が面倒なのかもしれませんね。
さて、本題ですが、私のようにWebはutf-8が読めても、メールは読めな い者はそれほど稀ではないかと思います。これについて、本件のような 通知メッセージの場合は、英語(ISO 646の範囲)で書かれたメッセージ が併記されているとほぼ救われると思います。
多分,ああいう人たちは英語表記してあっても「読めない」とのたまい ます。
ごめんなさい。自分もutf-8で来る通知が読めないで困っていたのですが、英語 表記なら「読めない」とは言わないつもりです。
-- njt