文字コード

漢字は大好きだけど、文字コードの問題は本当にややこしい。
コードによってバイト数変わってくるし。


いろいろ不正確だけど、日本語に関して簡単にまとめるなら、


シフトJIS:半角英数字・半角カナは1バイト、全角文字は2バイト、マイナーな文字は使えない。
EUC-JP:半角英数字は1バイト、半角カナ・全角文字は2バイト、マイナーな文字は使えない。
UTF-8:半角英数字は1バイト、半角カナ・全角文字は3バイト、マイナーな文字は2〜6バイト
UTF-16:半角英数字・半角カナ・全角文字は2バイト、マイナーな文字は2 or 4バイト
UTF-32:ぜんぶ4バイト


シフトJISは、等幅フォントだと文字列の横幅が必ずバイト数×半角幅になるんで計算しやすいね。
僕は多言語万歳が信条だけど、マイコン屋としてはシフトJISには今なお利点があると思ってる。