古い記事
ランダムジャンプ
新しい記事
茶筌ネタ。
半角アルファベット・数字を文字単位に区切らないようにするには?

デフォルトだとこうなってしまいます:
% chasen
第26回Wiki小話
第 ダイ 第 接頭詞-数接続
2 ニ 2 名詞-数
6 ロク 6 名詞-数
回 カイ 回 名詞-接尾-助数詞
W ダブリュー W 記号-アルファベット
i アイ i 記号-アルファベット
k ケイ k 記号-アルファベット
i アイ i 記号-アルファベット
小話 コバナシ 小話 名詞-一般
EOS
そこで chasenrc を ~/.chasenrc にコピーして、
;(COMPOSIT_POS ((名詞 数))
; ((記号 アルファベット)))
のコメント(行頭のセミコロン)を取ります。
するとアルファベット・数字連続が一単語として認識されます。
% chasen
第26回Wiki小話
第 ダイ 第 接頭詞-数接続
26 ニロク 26 名詞-数
回 カイ 回 名詞-接尾-助数詞
Wiki ダブリューアイケイアイ Wiki 記号-アルファベット
小話 コバナシ 小話 名詞-一般
EOS

MeCab[2006-02-25-4]の場合はデフォルトでOK。