Unicode 面倒くせぇ

放置プレイになっていた NAS をやっといじり始めている。で、Classic Mac やら Win98 やら有象無象が未だ夢覚めやらぬ状況なので、ファイル名に使っちゃいけない文字をチェックしようとしている。

NAS 上では utf-8 でファイル名が保存されているようなので、nfs でマウントして Ruby で -Ku でやればいいかーと思って作業を始めた。(こういう用途を想定して nfs に対応した NAS にしたのだ。)

  1. mule-ucs を入れて動かす → 起動が死ぬほど重くなる
  2. terminal が euc だと本来表示させたい文字が出ないのは当然として、utf-8 にしてもフォントが対応してなきゃ同じ → なんだか徒労の気配orz
  3. 読めない文字についてチェックするために hexl-mode 大活躍。でも hexl-mode にしたらなぜか日本語読めない(utf-8 のときは出ないのか?)ので、どれがダメな文字なのか特定するのに四苦八苦。
  4. VirtualPC on OSX, BasiliskII on Win, SheepShaver on Linux 大活躍。

重たいわ。うざいわ。

つーかこの辺のノウハウってどこかで共有されてないのだろうか。Samba も netatalk も WebDAV も日本語周りで必ず悩みが出てくるわけだけど、こうしたサービスの開発チームだけでなく、運用のノウハウ共有ってのが必要なような気がするなぁ。

More