PubSubHubbub を知る

※ 例によって 2ヶ月前の日記を書いています。

ブックマークだけしてあってよく分からない記事があったのでリアルタイム人力検索(Twitter)に投げてみた。返事が返ってこないことが多いが、今回はかなり正確に検索できた。

10:56:49 >wtnabe< 【急募】PubSubHubbubを140文字以内で説明してくれる人
11:10:31 <rytich> @wtnabe Publisher(公開者)がSubscripter(購読者)に対し
てプッシュで更新を通知するためのhubだバブー (Pubはwebhookでhubに更新を
通知するようです)
11:13:10 >wtnabe< .@rytich あーえーと Web サービス型の RSS リーダの更新
が早くなるよってことですか。なんかそんな気がする。
11:16:05 >wtnabe< Subscriber に POST するってことは少なくとも
Subscriber は常にそれを受け取る準備してなきゃいけないわけで。
11:16:36 <rytich> @wtnabe たぶんそうだと思います! あとRSSリーダは 定期
的に見に行ったりしなくてよくなるので 楽になりそうです
11:20:13 >wtnabe< 乱暴に言うと update ping を集積してクロールの無駄を省
いてくれる hub かな? Publisher はやっぱ hub を認識できてないと早くなら
ないよね。
11:23:06 >wtnabe< えーとそれが livedoor Blog が対応しましたって話か。
blog と reader 両方を持ってるところはそら対応するに決まってますがな、っ
てわけか。

えーと確認のために PubSubHubbub の登場人物を整理すると

  1. Publisher は要はブログ(だけじゃないけど)
  2. Subscriber はフィードリーダ
  3. これの間を取り持つ Hub

で、PubSubHubbub とはこの Hub を定義するプロトコル(?)のことで、Publisher と Subscriber の両方が Hub に「対応」することでかなりリアルタイムに近い通知が可能になるというものらしい。

update ping という言葉はたぶん古くなっちゃってて最近は webhook という言葉に集約されつつあるのかな? いろんなサービスに機能が増えてきているみたい。

ブログとフィードリーダという言葉は分かりやすさのために使っているだけで、こういう形態のサービスに限らずに使えそうな気がする。今後 Publisher の対応は進んでいくだろうから、例えば定期的に scrape して情報を更新する泥臭い作業も Hub -> Subscriber の POST を受け付ける URI があれば無駄がなくなるし速くなるし一石二鳥。1

ということで、いろいろ調べているうちに今回の1つの新しい知識と一緒に2つの疑問が増えた。

  • webhooks
  • reversehttp

今後の課題ということで。ぼんやーりとは想像つくんだけど。

_whyたん

ちなみにこの頃、_why ショックが駆け巡っていた。

11:29:43 >wtnabe< えっ。_why たん。

RSSCloud

[追記]

RSSCloud というものもあって、これと対比させるとより分かりやすいみたい。

個人的には RSSCloud は RSS 2.0 の中に収まっちゃってるのが嬉しくない。RSS 1.0 や Atom にも対応できるのかなぁ?

  1. scrape の必要な情報源が Publisher として Hub に対応してるの?という疑問は当然あるけど、feedに含まれる情報で満足できない場合には重宝すると思う。いっとき feed へのアクセスはちゃんと考えてやれよ(304に対応しろ)という話題もあったしね。 

More