きむらさんの雑記帖feed化計画

※ 無駄に面倒なこと考えてました。コメントにあるように Yahoo! Pipes の

zakkicho

がいいと思います。

あと、それPlaな人たちはやはり自分で解決しちゃうのが常識っぽい。

本を読む 「ときどきの雑記帖 リターンズ」のRSS

考えると作ったらその場で feed の公開(&ホスティング)までできちゃう Yahoo! Pipes はやっぱいいよなぁ。もうちょっと多様なページやfeedの読み込みに対応できたり、エンコーディングの変換ができたりなんかするとすごく嬉しいんだが。


今どき feed がなくて不便でしゃーないことで有名なきむらさんのときどきの雑記帖ですが、こんな感じで scrape できるんじゃないかな。

  1. index の <h2>過去の雑記帖</h2>
  2. の次の一個目のol
  3. の最後の要素
  4. に最新の permalink 確定ページの URL がある
  5. そのページを fetch して
  6. //div[@class="entry"] を引っこ抜きまくる
  7. 細かいゴニョゴニョは未確認
  • 日付への link はいいかな?
  • okotoba も無視の方向で

誰か作って。

ちなみに今、自分は myrss.jp にツッコんで feed を生成させて、更新通知代わりにして、結局 zakkicho に直接アクセスしてます。ページが長いし、非常にブラウザに優しくないです!

以前と違って permalink 確定が早い(もしや index の更新と同時?)なので、上の方法で scrape して十分使いものになりそうな感じ。

というか、とっとと容量制限で rimnet 追い出されてくれりゃまともなツールを使うようになるんじゃなかろうかw

More