utf-8 なページ for Namazu
NKF でそれぞれのページを euc に変換してからわかち書きのプログラムに食わせるので、NKF の対応していないコードだと正しくインデックスを起こせない。
nkf は 2.02 以降で utf-8 対応を果たした。また、これに対応する NKF.pm も出ているので、NKF.pm と実際のライブラリバイナリを 2.02 以上に上げると utf-8 なページに対応できる。nkf の実行バイナリでインデックスを起こすと遅いので NKF.pm を選択しないメリットはない。FreeBSD では ports で入れられる。deb パッケージもあるので Debian も ok. あとは知らない。