きむらさんの雑記帖feed化計画
※ 無駄に面倒なこと考えてました。コメントにあるように Yahoo! Pipes の
がいいと思います。
あと、それPlaな人たちはやはり自分で解決しちゃうのが常識っぽい。
考えると作ったらその場で feed の公開(&ホスティング)までできちゃう Yahoo! Pipes はやっぱいいよなぁ。もうちょっと多様なページやfeedの読み込みに対応できたり、エンコーディングの変換ができたりなんかするとすごく嬉しいんだが。
今どき feed がなくて不便でしゃーないことで有名なきむらさんのときどきの雑記帖ですが、こんな感じで scrape できるんじゃないかな。
- index の <h2>過去の雑記帖</h2>
- の次の一個目のol
- の最後の要素
- に最新の permalink 確定ページの URL がある
- そのページを fetch して
- //div[@class="entry"] を引っこ抜きまくる
- 細かいゴニョゴニョは未確認
- 日付への link はいいかな?
- okotoba も無視の方向で
誰か作って。
ちなみに今、自分は myrss.jp にツッコんで feed を生成させて、更新通知代わりにして、結局 zakkicho に直接アクセスしてます。ページが長いし、非常にブラウザに優しくないです!
以前と違って permalink 確定が早い(もしや index の更新と同時?)なので、上の方法で scrape して十分使いものになりそうな感じ。
というか、とっとと容量制限で rimnet 追い出されてくれりゃまともなツールを使うようになるんじゃなかろうかw