Vitruvian Penguin
knoppix

[knoppix:4274] Re: ext2かext3でUTFの文字化けについて

Date: Tue, 26 Oct 2004 09:24:35 +0900
X-mailer: Microsoft Outlook Express 6.00.2900.2180
返信ありがとうございます。


NTFS とか VFAT(の long filename)とか HFS+ の等はファイルシステムにお
けるファイル名の符号化法が決まっている(Unicode に基づく encoding と正
規化法)、つまり、ファイル名が文字列であるのに対し、ext2 などの一般的
な UNIX 系のファイルシステムはファイル名が、事実上、文字列ではなくて
byte 列であるといえます。

byte列ということをすっかり忘れていました。
私が文字化けしていると感じたのは、puttyで接続したさいに ls コマンド等で
確認したところ文字が化けていました。
ところがterminal等の端末では、正常にUTF8で返していました。

そういう訳で、どこで文字符号として解釈されたり、利用者に見えたりするの
かというと、terminal であったり、ファイルを操作するアプリケーションで
あったりする訳です。そして、それらは locale によって振舞を変えます(つ
まり、プロセス毎に違う設定が可能になる(多分、これは良くないこと))。

つまり、terminal やファイルブラウザ等の locale を ja_JP.UTF-8 等にすれ
ばちゃんと見えるようになると思いますし、そうでなくても一貫して byte 列
として扱えば問題は生じないと思います。ただ、NTFS や VFAT, Samba 等が絡
むと後者の方法ではすまなくなるので、少なくともファイル名に関わる部分に
関しては ja_JP.UTF-8 化して運用するのがお勧めです。

そうですね、LANGやlocaleなどを一度見直してみないといけないですね。

余談ですが、少し前、某セミナー用に CHISE Project の成果物を入れた
KNOPPIX を作ったのですが、これは locale をなるべく ja_JP.UTF-8 化して
ます。大きすぎて DVD に焼くか NTFS boot するしかないというちょっと難有
り状態ですが興味があればどうぞ。

root イメージ:
 http://kanji.zinbun.kyoto-u.ac.jp/projects/chise/dist/KNOPPIX/KNOPPIX

ISO イメージ:

http://kanji.zinbun.kyoto-u.ac.jp/projects/chise/dist/KNOPPIX/knoppix_v3.4_chise-2004-09-07.iso

今、DVDを焼く環境や、NTFS bootができる環境がないので、試せないですが、
かなり便利そうですね。現在の自分にとってありがたいKNOPPIXです。

また、ここで、報告させていただきます。
アドバイスありがとうございました。

ゆういちろう 
<Prev in Thread] Current Thread [Next in Thread>