2007-06-01

find + cpio でほしいファイルだけツリー構造を保持して取り出す

昨日ハマったので別解を探す。rsync の include, exclude には頼らずに必要なファイルだけのツリーを作るというところまでは同じなんだけど、ファイル群が巨大すぎて全体のコピーなんてやってられませんという場合には必要なファイルだけを取り出す作業が必要になる。

[2007-06-07 追記]

以前 tar 方式を試したが予想通りファイルが多すぎたらダメになったので、ちゃんと cpio について調べた。そしたら以下のように超簡単に書けることが分かった。

find PATH \( EXPRESSION \) -a print0 | cpio -p0d DEST

find の -print0 は書いた瞬間に true が返ってしまい、すべてのファイルが対象になってしまうので最後に書く。

cpio の -0 オプションは GNU cpio じゃないと使えないですね…。BSD だと pax の -s \0 とかで代用できるのかな?


※ こっから下はエントリの日付通りの日に試したみた結果。案の上 tar -cf ではファイルの数が多すぎたときに途中でアーカイブがクリアされてしまう。

一カ所にコピーしたいんじゃなくて階層も保持したいのでとりあえず tar に突っ込む方式にした。つーことはこんな感じか。

find PATH EXPRESSION | xargs tar -cf ARCHIVE

実際にはアーカイブを作成せずに一気に別な場所にコピーすることも可能だが、まぁそれは次の段階ということで。ファイルの数が多すぎると -c で作っているんで問題が起きるような気がする1んだけど、そこら辺をどうやって回避したらいいかまでは考えてないです。(最初にアーカイブを空っぽで作成して append していかなくていいのか?とか)

なんか最初無理に複雑にして BSD と GNU/Linux の違いにハマっていきましたが、実は単純でした。ありがとう > 隣の席の人

  1. xargs から tar が複数回に分けて呼び出されるとまずいってこと。 

今ごろ NeoOffice 2.1 入れる

ダウンロードしただけで手元の機械は 2.0 beta 3 + patch 15 のままだったのに気づいたので改めてインストール。

なんでこんなことになるかというと大物はすべてサーバ上で wget しているからです。落として満足し続けてた。アホすぎる。

ちょっと beta の頃より動きが軽いか? 今度こそ本当に満足満足。

About

例によって個人のなんちゃらです

Recent Posts

Categories

Tool 日々 Web Biz Net Apple MS ことば News Unix howto Food PHP Movie Edu Community Book Security Text TV Perl Ruby Music Pdoc 生き方 RDoc ViewCVS CVS Rsync Disk Mail FreeBSD Cygwin PDF Photo Zebedee Debian OSX Comic Cron Sysadmin Font Analog iCal Sunbird DNS Linux Wiki Emacs Thunderbird Sitecopy Terminal Drawing tDiary AppleScript Life Money Omni PukiWiki Xen XREA Zsh Screen CASL Firefox Fink zsh haXe Ecmascript PATH_INFO SQLite PEAR Lighttpd FastCGI Subversion au prototype.js jsUnit Apache Trac Template Java Rhino Mochikit Feed Bloglines CSS del.icio.us SBS qwikWeb gettext Ajax JSDoc Rails HTML CHM EPWING NDTP EB IE CLI ck ThinkPad Toy WSH RFC readline rlwrap ImageMagick epeg Frenzy sysprep Ubuntu MeCab DTP ERD DBMS eclipse Eclipse Awk RD Diigo XAMPP RubyGems PHPDoc iCab DOM YAML Camino Geekmonkey w3m Scheme Gauche Lisp JSAN Google VMware DSL SLAX Safari Markdown Textile IRC Jabber Fastladder MacPorts LLSpirit CPAN Mozilla Twitter OpenFL Rswatch ITS NTP GUI Pragger Yapra XML Mobile Git Study JSON VirtualBox Samba Pear Growl Mercurial Rack Capistrano Rake Win RSS Mechanize Sitemaps Android JavaScript Python RTM OOo iPod Yahoo Unicode Github iTunes God SBM friendfeed Friendfeed HokuUn Sinatra TDD Test Project Evernote iPad Geohash Location Map Search Simplenote Image WebKit RSpec Phone CSV WiMAX USB Chrome RubyKaigi RubyKaigi2011 Space CoffeeScript Nokogiri Hpricot Rubygems jQuery Node GTD CI UX Design VCS Kanazawa.rb Kindle Amazon Agile Vagrant Chef Windows Composer Dotenv PaaS Itamae SaaS Docker Swagger Grape WebAPI Microservices OmniAuth HTTP 分析基盤 CDN Terraform IaaS HCL Webpack Vue.js BigQuery Middleman CMS AWS PNG Laravel Selenium OAuth OpenAPI GitHub UML GCP TypeScript SQL Hanami Document SVG AsciiDoc Pandoc DocBook Develop Jekyll macOS Node.js Vite Heroku Transformer AI Data Cloud Wasm