たつをの ChangeLog : 2006-02-24


テレビ論争。あちこちで盛り上がっています。

- 日経ビジネス EXPRESS :【大橋巨泉氏】金持ち、勝ち組、インテリはテレビなんか見なくなった
http://nb.nikkeibp.co.jp/free/tvwars/interview/20060127005218.shtml
- naoyaのはてなダイアリー - テレビを見ない人、見る人
http://d.hatena.ne.jp/naoya/20060217/1140153832
- ARTIFACT@ハテナ系 - テレビを見るのは低所得者層話
http://d.hatena.ne.jp/kanose/20060223/tvpoor
- 昨日の風はどんなのだっけ? -
新たな特権意識の発露という気がしないでもない
http://d.hatena.ne.jp/toronei/20060217/G

いろいろと論点はあると思いますが、私は単に
「テレビばかり見てると他のことをやる時間が少なくなる」
という当たり前の話だな、と認識しました。
ブログばかり読んでる、SNSばかりやってる、ゲームばかりやってる、映画・DVDばかり観てる、本・雑誌・マンガばかり読んでる、まあいろいろありますね。

このようなインプットばかりでなく、アウトプットも大切というのはもはやネット時代における定説なのですが、ブログばかり書いてる、つまりアウトプットばかりしているってのは、何か他にするべき大切なことのための時間が減ってるってことかもしれないですね。

…と自戒。

Perl モジュール Text::ChaSen を使ってみたい!というわけで、
すっかりメンテナンスされてない chasen をソースからインストール。

オフィシャルページ <http://chasen.naist.jp/> にある
「ソースからのインストール」を参考に。

■darts の install のポイント:
<http://www.chasen.org/~taku/software/darts/>
darts 0.3 だと chasen-2.3.3 のコンパイルに失敗する。
理由は darts 0.3 からのメソッド名変更。
メッソド名の一部変更 (setArray を set_array になど)
そこで darts 0.2 を使う。リンクはないので、以下のURLで直接入手。
<http://www.chasen.org/~taku/software/darts/src/darts-0.2.tar.gz>
(茶筌用に後方互換メソッドを残してもらえるとありがたし> taku-ku)

■chasen-2.3.3 の install のポイント:
./configure --with-darts=/usr/local/include --with-libiconv=/usr/local

■ipadic-2.7.0 の install はすんなり。
/usr/local/lib/chasen/dic/ipadic/ に辞書データが入った。

■さて実行。たまたま別バージョンのRCファイルが入っていたようなので、
「-r」で直接指定。
% chasen -r /usr/local/lib/chasen/dic/ipadic/chasenrc
これはペンです。
これ コレ これ 名詞-代名詞-一般
は ハ は 助詞-係助詞
ペン ペン ペン 名詞-一般
です デス です 助動詞 特殊・デス 基本形
。 。 。 記号-句点
EOS
OK! 次へ。

■chasen-2.3.3 の perl モジュール install のポイント:
perl/Makefile.PL の変更。
'LIBS' => ['-L/usr/local/lib -lchasen -lstdc++']
READMEと<http://chasen.aist-nara.ac.jp/ml/chasen-users/msg00403.html>
より。

■さてさて、Perlのサンプルプログラムを実行(文字コードはEUC-JP)。
% cat a.pl
use Text::ChaSen;
$res = Text::ChaSen::getopt_argv('chasen-perl', '-j', '-f');
print Text::ChaSen::sparse_tostr("日本語の文字列");
% perl a.pl
chasen: /usr/local/etc/chasenrc: dictionary is not specified
別バージョンのデフォルトRCファイルを読みに行ってエラー。

■いちいち指定するのも面倒だし、かといってデフォルトのRCファイルを
上書きするのもあれなので、初めから
/usr/local/lib/chasen/dic/ipadic/chasenrc を読みに行かせる作戦。
強引に configure を書きかえてリビルド。
RCPATH="/usr/local/lib/chasen/dic/ipadic/chasenrc"
% perl a.pl
日本語 ニホンゴ 日本語 名詞-一般
の ノ の 助詞-連体化
文字 モジ 文字 名詞-一般
列 レツ 列 名詞-一般
EOS
OK! 今度はうまく行った!

■なんだかんだで2時間近くかかった…。バッドノウハウーーー。

■今まで内部から /usr/local/bin/chasen を直接呼んで使っていたので
すが、ChaSenモジュールに置き換えていく所存。
ついでにChaSenを使ったPerlモジュールを公開していく予定。


追記060225: MeCab に乗り換えました。see [2006-02-25-4]
この記事に言及しているこのブログ内の記事

Yahoo!検索に、日本語を母国語とする人向けの英単語スペルチェッカー
機能が!!! なかなかうまくいってるっぽいです。

英語が苦手なあなたに朗報!〜検索結果でのローマ字・英語スペルチェック
を大幅強化 - Yahoo!検索 スタッフブログ
<http://blogs.yahoo.co.jp/yjsearchblog/26676714.html>
従来の英語のスペルミスに対応するスペルチェックに加えて、ローマ字な
ど、日本語を母国語にする人がよく間違えるスペルミスに対応しています。

スペル修正

ローマ字入力でも元のスペルにマッチ!
shuwarutunegga, burogu, burijitto,
pabirion, roketto, cnetto

ローマ字表記交じりのあいまい英単語スペルも。
makudonald, diffikaruto, fesutebal

「えいご漬け」に挑戦し始めて1週間たちました[2006-02-18-8]
1週間で250語。このペースなら8週間で終わるぞ!
しかしやはり平日はきついですね。朝は眠いし、夜は疲れているし。だい
たい10語で10〜15分かかるのですが、何セットも続けると集中力が切れま
くりです。ということで、平日は無理せず朝10、夜10くらいで今後も続け
られるといいのですが。

画像
DateWords
2006/2/1870
2006/2/1980
2006/2/2020
2006/2/2120
2006/2/2210
2006/2/2320
2006/2/2430

私がやってるのは、マスタリー2000のAmazon Editionですが、
楽天バージョンのえいご漬けもあります。ダウンロード販売で1200円。
「やり直し英語」には良いかも。
◆トレーニングセンテンス数:1,470文
◆すべてのセンテンスにわかりやすい文法解説がついています。
◆すべてのセンテンスにネイティブの発音がついています。
◆中学レベルから高校3年間で学習するレベルまでの文法項目をカバーし
ています。
えいご漬け 楽天バージョン
この記事に言及しているこのブログ内の記事

たつをの ChangeLog
Powered by chalow