2010-09-28

マッチしなかった要素を探す

ちょっと表現が微妙なんだけど

  • 正規表現マッチを使い
  • マッチしない要素(行など)

を探す方法が急に気になったのでまとめてみた。

grep -v

GNU grep, BSD grep の場合は -v オプションが使える。–invert-match で、まさに「マッチしなかった行を探す」目的に使う。

awk '!/RE/'

awk の場合は基本的な動作を

パターン { アクション }

で記述する。このパターンを ! で否定すればマッチしない場合の動作を簡単に記述できる。

フィールドなどを明示する場合は

$1 ~ /RE/

がマッチするパターンで

$1 !~ /RE/

がマッチしないパターンになる。この ~, !~ の書き方は他の多くの LL にも採用されている。少なくとも Perl, Ruby では ~ を =~ で置き換えるだけでパターンの部分は記述できる。

Perl の grep()

Perl には list の中から特定のパターンにマッチする要素だけを抜き出す grep() 関数がある。これは

grep( /RE/, LIST )

という形で使う1。このとき !/RE/ とすればマッチしないものだけを抜き出せる。

Ruby の Enumerable#grep()

Ruby には Perl の grep によく似た機能があって、それが Enumerable#grep(). 構文こそ違うけど、働きはよく似ている。ただし、

Enumerable#grep( !/RE/ )

とは書けない。どうするのかなぁと思ったけど、こう書くしかないのかな?

Enumerable#select { |e| e !~ /RE/ }
Enumerable#find_all { |e| e !~ /RE/ }
Enumerable#reject { |e| e =~ /RE/ }

最近は find_all が有名っぽいので find_all で否定のマッチを書く場合が多いのかも。reject は意味は分かるけどまどろっこしい感じがする。

PHP の preg_grep()

PHP には PCRE を使って正規表現周りの機能を実現している preg_XXX() 関数群があって、この中に Perl の grep() のような preg_grep() がある。ただし、PHP には正規表現リテラルはないので

preg_grep( !/RE/, array() )

のようには書けない。どうするかというと、

preg_grep( '/RE/', array(), PREG_GREP_INVERT )

のように第3引数に PREG_GREP_INVERT という定数を与えてやる。

sed -ne '/RE/!p'

[2010-10-123 追記]

Twitter / eban: @finalfusion えー? sed -ne ' …

さらにツッコミがあったので。場外場外。

sed 使ってないので未確認で垂れ流しますよ。

[2010-10-11 追記]

Twitter でツッコミがあったので。

sed の説明はしません(笑)

改めて思うと !/RE/ の書き方は awk じゃなくて sed 由来かな? あるいはもしかして ed ? じゃないよな、たぶん。

  1. だけじゃないけど 

About

例によって個人のなんちゃらです

Recent Posts

Categories

Tool 日々 Web Biz Net Apple MS ことば News Unix howto Food PHP Movie Edu Community Book Security Text TV Perl Ruby Music Pdoc 生き方 RDoc ViewCVS CVS Rsync Disk Mail FreeBSD Cygwin PDF Photo Zebedee Debian OSX Comic Cron Sysadmin Font Analog iCal Sunbird DNS Linux Wiki Emacs Thunderbird Sitecopy Terminal Drawing tDiary AppleScript Life Money Omni PukiWiki Xen XREA Zsh Screen CASL Firefox Fink zsh haXe Ecmascript PATH_INFO SQLite PEAR Lighttpd FastCGI Subversion au prototype.js jsUnit Apache Trac Template Java Rhino Mochikit Feed Bloglines CSS del.icio.us SBS qwikWeb gettext Ajax JSDoc Rails HTML CHM EPWING NDTP EB IE CLI ck ThinkPad Toy WSH RFC readline rlwrap ImageMagick epeg Frenzy sysprep Ubuntu MeCab DTP ERD DBMS eclipse Eclipse Awk RD Diigo XAMPP RubyGems PHPDoc iCab DOM YAML Camino Geekmonkey w3m Scheme Gauche Lisp JSAN Google VMware DSL SLAX Safari Markdown Textile IRC Jabber Fastladder MacPorts LLSpirit CPAN Mozilla Twitter OpenFL Rswatch ITS NTP GUI Pragger Yapra XML Mobile Git Study JSON VirtualBox Samba Pear Growl Mercurial Rack Capistrano Rake Win RSS Mechanize Sitemaps Android JavaScript Python RTM OOo iPod Yahoo Unicode Github iTunes God SBM friendfeed Friendfeed HokuUn Sinatra TDD Test Project Evernote iPad Geohash Location Map Search Simplenote Image WebKit RSpec Phone CSV WiMAX USB Chrome RubyKaigi RubyKaigi2011 Space CoffeeScript Nokogiri Hpricot Rubygems jQuery Node GTD CI UX Design VCS Kanazawa.rb Kindle Amazon Agile Vagrant Chef Windows Composer Dotenv PaaS Itamae SaaS Docker Swagger Grape WebAPI Microservices OmniAuth HTTP 分析基盤 CDN Terraform IaaS HCL Webpack Vue.js BigQuery Middleman CMS AWS PNG Laravel Selenium OAuth OpenAPI GitHub UML GCP TypeScript SQL Hanami Document SVG AsciiDoc Pandoc DocBook Develop Jekyll macOS Node.js Vite Heroku Transformer AI Data Cloud Wasm