Unicode 周り
Perl は 5.6.x 以降 unicode 対応だが、どうもデキが悪いらしく、5.8.1 以降が本命の様子。ただし、Perl はベースシステムに入っているので Debian で 5.8.x に上げるのはちと面倒。FreeBSD ではやってみてないけど、ports で入れる分には勝手にしろって感じじゃないのかな? ということで Debian では 5.6.1 のまま Jcode.pm をかますのが無難。Jcode.pm はパッケージですぐ入れられる。(ports もあるで。)Jcode.pm と use Encoding と両方で動くバージョンを書くのはさすがに大変か? だろうなぁ。
Ruby では Kconv が標準ライブラリなので unicode 以外の扱いは楽。unicode を扱う Uconv は別途インストールが必要だが、Debian パッケージ、ports ともに入っているのでインストールは楽。Ruby の場合は Uconv 前提でスクリプトを書くのがまだしばらくは主流だろう。
あ、PHP は mbstring モジュールが utf-8 対応なので、日本語を扱うために mbstring を有効にしたらそのまま Unicode が扱える。PHP がいちばん手厚いな。