Vitruvian Penguin
knoppix

[knoppix:4272] Re: ext2かext3でUTFの文字化けについて

Date: 25 Oct 2004 18:56:15 +0900
User-agent: Chaos/1.13.1 SEMI/1.14.6 (Maruoka) FLIM/1.14.7 (Sanj APEL/10.6 CHISE-MULE/0.21 (Narayama) XEmacs/21.4 (patch 15) (Security Through Obscurity) (powerpc-apple-darwin7.4.0)
はじめまして、守岡と申します。

>>>>> In [knoppix : No.4268] 
>>>>>   "ゆう" = ゆう <you@xxxxxxxx> wrote:

ゆう> > マウント時にUTFを指定できたと思います。
ゆう> > 調べていないので、ウラをとって下さい。

ゆう> mount時のタイプでUTF指定をできるものは、ntfsとvfat...etcで、
ゆう> ext2のファイルシステムのマウントオプションではなかったので
ゆう> mount時に指定ができませんでした。

NTFS とか VFAT(の long filename)とか HFS+ の等はファイルシステムにお
けるファイル名の符号化法が決まっている(Unicode に基づく encoding と正
規化法)、つまり、ファイル名が文字列であるのに対し、ext2 などの一般的
な UNIX 系のファイルシステムはファイル名が、事実上、文字列ではなくて
byte 列であるといえます。

そういう訳で、どこで文字符号として解釈されたり、利用者に見えたりするの
かというと、terminal であったり、ファイルを操作するアプリケーションで
あったりする訳です。そして、それらは locale によって振舞を変えます(つ
まり、プロセス毎に違う設定が可能になる(多分、これは良くないこと))。

つまり、terminal やファイルブラウザ等の locale を ja_JP.UTF-8 等にすれ
ばちゃんと見えるようになると思いますし、そうでなくても一貫して byte 列
として扱えば問題は生じないと思います。ただ、NTFS や VFAT, Samba 等が絡
むと後者の方法ではすまなくなるので、少なくともファイル名に関わる部分に
関しては ja_JP.UTF-8 化して運用するのがお勧めです。


余談ですが、少し前、某セミナー用に CHISE Project の成果物を入れた
KNOPPIX を作ったのですが、これは locale をなるべく ja_JP.UTF-8 化して
ます。大きすぎて DVD に焼くか NTFS boot するしかないというちょっと難有
り状態ですが興味があればどうぞ。

root イメージ:
  http://kanji.zinbun.kyoto-u.ac.jp/projects/chise/dist/KNOPPIX/KNOPPIX

ISO イメージ:
  
http://kanji.zinbun.kyoto-u.ac.jp/projects/chise/dist/KNOPPIX/knoppix_v3.4_chise-2004-09-07.iso

-- 
守岡 知彦 (MORIOKA Tomohiko) <tomo@xxxxxxxxxxxxxxxxxxxxxxxxxx>
<Prev in Thread] Current Thread [Next in Thread>