よくやる作業についてメモ。
単語等の分布をざっくり見るときなど。
単語等の分布をざっくり見るときなど。
cat sample.txt (TSV) 旅行 男 ゲーム 男 ゲーム 女 旅行 男 ゴルフ 男 山登り 男 手芸 女 ゴルフ 男 アロマ 女 旅行 女 ライブ 女
perl -F"\t" -anle '
$h{$F[0]}{$F[1]}++;
$s{$F[0]}++;
END{
for$i(sort{$s{$b}<=>$s{$a}}keys%h){$r=$h{$i};
print join("\t",$i,$s{$i},map{"$_:$$r{$_}"}
sort{$$r{$b}<=>$$r{$a}||$a cmp $b}keys%$r)}
}
' sample.txt
旅行 3 男:2 女:1
ゴルフ 2 男:2
ゲーム 2 女:1 男:1
ライブ 1 女:1
山登り 1 男:1
手芸 1 女:1
アロマ 1 女:1
この記事に言及しているこのブログ内の記事
