2008-09-03 [長年日記]
_ きむらさんの雑記帖feed化計画
※ 無駄に面倒なこと考えてました。コメントにあるように Yahoo! Pipes の
がいいと思います。
あと、それPlaな人たちはやはり自分で解決しちゃうのが常識っぽい。
考えると作ったらその場で feed の公開(&ホスティング)までできちゃう Yahoo! Pipes はやっぱいいよなぁ。もうちょっと多様なページやfeedの読み込みに対応できたり、エンコーディングの変換ができたりなんかするとすごく嬉しいんだが。
今どき feed がなくて不便でしゃーないことで有名なきむらさんのときどきの雑記帖ですが、こんな感じで scrape できるんじゃないかな。
- index の <h2>過去の雑記帖</h2>
- の次の一個目のol
- の最後の要素
- に最新の permalink 確定ページの URL がある
- そのページを fetch して
- //div[@class="entry"] を引っこ抜きまくる
- 細かいゴニョゴニョは未確認
- 日付への link はいいかな?
- okotoba も無視の方向で
誰か作って。
ちなみに今、自分は myrss.jp にツッコんで feed を生成させて、更新通知代わりにして、結局 zakkicho に直接アクセスしてます。ページが長いし、非常にブラウザに優しくないです!
以前と違って permalink 確定が早い(もしや index の更新と同時?)なので、上の方法で scrape して十分使いものになりそうな感じ。
というか、とっとと容量制限で rimnet 追い出されてくれりゃまともなツールを使うようになるんじゃなかろうかw
[TrackBack URL: http://aligach.net/diary/tb.rb/20080903]
私は「なんでも RSS」を使ってますが、それなりに拾えています。
なんでもRSSってまだやってたんですか。なんか東工大はblogwatcherやめてるし、長いことサイト自体に繋がったことがないので終わってるものだと思ってました。今も繋がりません。移転したって話も聞かないし、どうなってんでしょ。
http://pipes.yahoo.com/satyr/zakkicho?_render=rss
↑良ければどうぞ。Pipesの機嫌が悪くなければ読めるはずです。
ktkr !!! 今まさに Pipes にログインしたところでした! ありがとうございます!
そうか。トップページの方にも permalink が埋まってたんですね。気づいてなかった。なるほど。miscapi.appspot.com が挟まってる辺りオサレです。Pipes 使うときは charset 周りで悩まされることが多いですね。