たつをの ChangeLog : 2012-08-30

今日から東京の一部の地下鉄において、車内にケータイ電波が届くようになりました。私が通勤に利用している日比谷線でもバリバリ使えました。

- 東京メトロのトンネル内での携帯ネット接続、8/30にエリア拡大 日比谷線など4路線で (はてなブックマークニュース)
http://b.hatena.ne.jp/articles/201208/10262

今までは駅でしか使えなかったのが、駅間、つまり暗いトンネルを走っているときでもネットできるのです! これは革命的! いろいろと捗ります。

とはいえ、「せっかくの貴重な無ネット空間が失われ、生活から一切のオフライン時間がなくなり、それによりネット依存が止まらず、ネット中毒になってしまう!」という被害(?)が出るかもしれませんね。たいへんだー。

多数のファイルの中身をまとめて処理したい場面は多々あるが、引数がたくさんすぎてエラーになりがち。
% ./get-noun-phase.pl dat/text/*.txt
zsh: argument list too long: get-noun-phase.pl
% cat dat/text/*.txt | ./get-noun-phase.pl
zsh: argument list too long: cat
% ls dat/text/ | egrep '\.txt$' | wc -l
18153

そこで find を使って解決。
% find dat/text/ -name '*.txt' -exec cat {} \; | ./get-noun-phase.pl

xargs との組み合わせが王道。こちらの方が断然速い。
% find dat/text/ -name '*.txt' | xargs cat | ./get-noun-phase.pl

ref.
- いまさらxargsの便利さを主張してみる (ディノオープンラボラトリ)
http://openlab.dino.co.jp/2008/02/20/133431188.html
- [を] find でディレクトリ中のファイルを指定された更新日時条件で削除[2011-11-17-2]
この記事に言及しているこのブログ内の記事

たつをの ChangeLog
Powered by chalow