PATH_INFO と <base> と Web の「完全」保存

ここんところ地味に調べていた範囲で分かったところ。

  • 動的に出力しているページは PATH_INFO のパラメータを利用するしないに関わらず、PATH_INFO 付きのリクエストが可能
  • PATH_INFO 付きのリクエストの際、クライアントがページの PATH を誤認してしまい、相対パスで指定されている画像などが正しく取得できないばかりか、この場合はすべての画像などのリクエストがスクリプト本体に集中する1
  • つまり、画像をたくさん使っているページは、PATH_INFO 付きリクエストをしただけで軽く DoS

といった動作が起きる。つーことで、動的に生成しているページでは PATH_INFO を利用している利用していないに関わらず <base> を吐くようにした方がよい。2面倒くさいから同じ意味を持つ HTTP ヘッダか何かないのかと思ったけど、どうやらそういうものはないらしい。

問題は <base> ってどのクライアントに対しても安心して使えるものなの?ということなんだけど、i-mode, Vodafone, EZweb, L-mode の HTML および XHTML の仕様には base 要素はありました。EZweb の proxy サーバによる XHTML → HDML 変換でもこれは生きるようです。WILLCOM では Opera か NetFront が標準と考え(超乱暴)、どの環境でも使えると踏んでいいんじゃなかろか。

で、ふと思ったのは、<base> を HTML の中に書いちゃったら、ローカルに保存してもそれが有効じゃん?てこと。試しにやってみたらバッチリ <base> の指示通り、ページが公開されていた URL に対して画像をリクエストしてくれた。警告も何も出ない。3んー。これってどうなんだろう? Thunderbird ではプライバシーやセキュリティの観点からリモートの画像をダウンロードしない設定が可能だけど、ブラウザの場合はどういう動作するのがいいのかね。

じゃあ「完全」保存の場合はどうなるの?と思ったら、これは以下のようになった。

ブラウザ <base>の処理
IE6SP2 コメントアウト
Firefox 1.0.7 コメントアウト
Opera 8.5 削除

どのブラウザも、ローカルに保存したファイルだけで完結するように HTML を修正している。

ついでに、「完全」てどの程度完全なのよ?と思って CSS の @import を利用しているページを保存してみた。今度は

ブラウザ @import への追随
IE6SP2 ×
Firefox 1.0.7 ×
Opera 8.5

こういう結果になった。Opera 優秀。と感じるが、Opera は注意が必要。保存したファイルは HTML も画像もすべて同じフォルダにどばっと保存される。うっかりデスクトップに保存した日にゃ大変な目に遭う。

  1. PATH_INFO が付いたまま画像などをリクエストするため。 

  2. すべて絶対パスで指定しているか、PATH_INFO 付きのアクセスを禁止するとか rewrite するとかしてるのなら話は別だけど。 

  3. とりあえず Firefox のデフォルトの設定ね。 

More

Categories

Tool 日々 Web Biz Net Apple MS ことば News Unix howto Food PHP Movie Edu Community Book Security Text TV Perl Ruby Music Pdoc 生き方 RDoc ViewCVS CVS Rsync Disk Mail FreeBSD Cygwin PDF Photo Zebedee Debian OSX Comic Cron Sysadmin Font Analog iCal Sunbird DNS Linux Wiki Emacs Thunderbird Sitecopy Terminal Drawing tDiary AppleScript Life Money Omni PukiWiki Xen XREA Zsh Screen CASL Firefox Fink zsh haXe Ecmascript PATH_INFO SQLite PEAR Lighttpd FastCGI Subversion au prototype.js jsUnit Apache Trac Template Java Rhino Mochikit Feed Bloglines CSS del.icio.us SBS qwikWeb gettext Ajax JSDoc Rails HTML CHM EPWING NDTP EB IE CLI ck ThinkPad Toy WSH RFC readline rlwrap ImageMagick epeg Frenzy sysprep Ubuntu MeCab DTP ERD DBMS eclipse Eclipse Awk RD Diigo XAMPP RubyGems PHPDoc iCab DOM YAML Camino Geekmonkey w3m Scheme Gauche Lisp JSAN Google VMware DSL SLAX Safari Markdown Textile IRC Jabber Fastladder MacPorts LLSpirit CPAN Mozilla Twitter OpenFL Rswatch ITS NTP GUI Pragger Yapra XML Mobile Git Study JSON VirtualBox Samba Pear Growl Mercurial Rack Capistrano Rake Win RSS Mechanize Sitemaps Android JavaScript Python RTM OOo iPod Yahoo Unicode Github iTunes God SBM friendfeed Friendfeed HokuUn Sinatra TDD Test Project Evernote iPad Geohash Location Map Search Simplenote Image WebKit RSpec Phone CSV WiMAX USB Chrome RubyKaigi RubyKaigi2011 Space CoffeeScript Nokogiri Hpricot Rubygems jQuery Node GTD CI UX Design VCS Kanazawa.rb Kindle Amazon Agile Vagrant Chef Windows Composer Dotenv PaaS Itamae SaaS Docker Swagger Grape WebAPI Microservices OmniAuth HTTP 分析基盤 CDN Terraform IaaS HCL Webpack Vue.js BigQuery Middleman CMS AWS PNG Laravel Selenium OAuth OpenAPI GitHub UML GCP TypeScript SQL Hanami Dev Jekyll