メールのSubjectヘッダに日本語が含まれる場合、通常MIMEでエンコードするわけですが、日本語の場合は(おそらく)歴史的経緯からCharsetはISO-2022-JPを使う場合がほとんどです。じゃ、他のCharsetを使っていけないか、というと、必ずしもそう決まっているわけではないと思うんですね。

そこでちょっと調べてみました。私がここ一年ほどで受け取ったメールで、SubjectがMIME encodeされていたものを対象に、使われていたCharsetを調べると

      1 BIG5
      3 EUC-JP
     38 GB2312
   9041 ISO-2022-JP
      5 ISO-8859-1
      3 ISO-8859-15
      1 KOI8-R
      1 SHIFT-JIS
     45 SHIFT_JIS
      1 UNICODE-1-1-UTF-7
      1 US-ASCII
     16 UTF-8
     86 WINDOWS-1251
      1 WINDOWS-1252
      1 WINDOWS-1254
      1 WINDOWS-874

な感じでした(各行の先頭の数字は出現回数)。

当然ISO-2022-JPがダントツなわけですがその他のCharsetもぼちぼちあります。気になるのはにSHIFT_JISやSHIFT-JIS。これはら正しいCharsetと言えるのか、判断が難しいところです。Shift JISなCharset自体はももちろんあり得る話だとは思うのですが、メールでこのような使い方をするのがOKなのかどうか微妙・・。

どなたか、ご存知の方お教えくださいまし。