たつをの ChangeLog : 2008-11-15

さくらの500円レンタルサーバで MeCab を使うための手順。
「MeCabをPerlから使う」[2006-02-25-4]を参考に。

MeCab は日本語形態素解析器です。
日本語文を単語に切り分けてくれます。

- MeCab: Yet Another Part-of-Speech and Morphological Analyzer
http://mecab.sourceforge.net/

ソースの入手は上記 URL から。

MeCab 本体のインストール


まずは本体を入れなければ話になりません。

tar zxfv mecab-0.97.tar.gz
cd mecab-0.97
./configure --prefix=/home/USERNAME/opt
make
make cheack
chmod a+x install-sh
make install
~/opt/bin/mecab -h <== 簡単な動作確認

辞書のインストール


本体があっても辞書が無いと解析できないですからねえ。

tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --prefix=/home/USERNAME/opt
make
make install

バイナリの動作確認:
% echo '鶏です' | nkf -We | ~/opt/bin/mecab | nkf -w
鶏      名詞,一般,*,*,*,*,鶏,ニワトリ,ニワトリ
です    助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
EOS

Perlモジュールのインストール


Perl で書く CGI スクリプトから使いたいので!

tar zxvf mecab-perl-0.97.tar.gz
cd mecab-perl-0.97
perl Makefile.PL PREFIX=/home/USERNAME
make
make test
make install
rsync -av blib/lib/ ~/lib/perl 
rsync -av blib/arch/auto ~/lib/perl/

「/home/USERNAME/lib/perl5/site_perl/5.8.8/mach/」
に入った。
.zshrc で Perl のパスを追加:
export PERL5LIB=$HOME/lib/perl:$HOME/lib/perl5/site_perl/5.8.8/mach/

動作確認スクリプト:
#!/usr/bin/perl
use strict;
use warnings;
use utf8;
use Encode;
use MeCab;
binmode STDOUT, ":utf8";
my $m = new MeCab::Tagger ("");
my $n = $m->parseToNode (encode('euc-jp', "美しい豚を食べた"));
while ($n = $n->{next}) {
    print decode('euc-jp',
         "$n->{surface} $n->{feature} $n->{cost}\n");
}
その実行結果:
美しい 形容詞,自立,*,*,形容詞・イ段,基本形,美しい,ウツクシイ,ウツクシイ 3862
豚 名詞,一般,*,*,*,*,豚,ブタ,ブタ 9952
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 9142
食べ 動詞,自立,*,*,一段,連用形,食べる,タベ,タベ 13197
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 10798
 BOS/EOS,*,*,*,*,*,*,*,* 9688

ちなみに Text::MeCab [2006-09-24-3]はテストで落ちたので
あきらめ。さようなら。
perl -MCPAN -e 'install Text::MeCab'

参考


- さくらでMeCab PHP extension (Making The Road Blog)
  http://makingx.net/blog/2007/08/02/
  mecab-php-install-at-sakura/


- [を] さくらの500円レンタルサーバーで
  SUFARY.pm を動かす[2008-08-20-3]

- [を] MeCabをPerlから使う[2006-02-25-4]

- [を] さくらのレンタルサーバ、三つ目[2008-08-23-1]

- [O] さくらサーバーにEmacsとScreenとZshとlvを入れる
  http://overlasting.dyndns.org/2006-06-04-2.html



さくらのレンタルサーバのサービス改定が11月19日にあって、
私が使ってる500円のコースでディスク容量が
1G から 3G になるそうです。わーい!

- 「さくらのレンタルサーバ」および「さくらのメールボックス」
  サービス改定のお知らせ
  http://support.sakura.ad.jp/page/news/20081112-001.news
この改定では、初期費用、月額料金は変わらず、
ディスク容量など仕様の強化を行い、
さらにコストパフォーマンスを追及いたしました。
また、既に対象サービスをご利用中のお客様につきましても、
本強化の内容を適用させていただく予定です。

ということで、これを見越して、
さっそく MeCab など入れてみたのでした[2008-11-15-1]
でも、まだ1G上限なのでディスク使用量が心配な感じになっちゃったよ。

ディスク使用量

19日までの辛抱です……。



ここ4年ほど毎年紹介していますが、季節になったので、
ワード、パワポ、エクセルの2009年カレンダー(無料)を紹介。

- 2009 年カレンダー - テンプレート - Microsoft Office Online
  http://office.microsoft.com/ja-jp/templates/CT102774121041.aspx

calcal

ワード、エクセルなどの Microsoft オフィス製品用の
2009年版の無料カレンダーテンプレートです。
ダウンロードは IE で行います。

昨年と同じ傾向で、
今年のも Office 2007 用のものがほとんどです。
最新の Office をお持ちの方はぜひぜひ。

ちなみに、家計簿やカロリーメモ用のテンプレートもあり、
古いMSオフィスでも使えるのがあったりしますので、
興味のある方はどうぞ。→ [2007-10-23-2]

過去の記事:
- [を] ワード、エクセルの2008年カレンダー(無料)[2007-10-22-2]
- [を] ワード、パワポ、エクセルの2007年カレンダー[2006-12-12-2]
- [を] 2006年のカレンダーはここで入手![2005-12-29-3]
- [を] 2005年カレンダー[2005-01-04-6]

2009 カレンダーストア (amazon)

自分のブログのサイドバーに
はてなブックマークで人気の自ブログ記事の一覧を表示するため、
さくらの500円レンタルサーバから
一時間に一回の頻度で「はてブRSS」にアクセスしていたのですが、
先月からアクセス禁止になってしまいました。

そこで、問い合わせフォームから以下のような文面で連絡しました。
自分のブログのサイドバーに、
はてなブックマークで人気の自ブログ記事を表示するため、
さくらの500円レンタルサーバ (IP *.*.*.*) より、
自動で一時間に一度下記の「RSS」のURLにアクセスしていました。
[略]
しかし、何日か前からサーバーからアクセス禁止 (403: Forbidden)
になってしまいました。
ご確認お願いします。

一週間ほどたって下記のようなお返事がきました。
社内の確認に時間がかかり、お返事が遅れ申し訳ございません。
「*.*.*.*」につきまして、
はてなブックマークにてアクセス制限が行われて
おりましたので、昨日解除させていただきました。
お手数ですがご確認いただけますでしょうか。

良かった、良かった。
お手数かけました。
ありがとうございます。

関連記事


- [を] はてブ八分にされてから復活するまで[2008-10-02-2]

恵比寿の Toshi Yoroizuka (恵比寿本店)が
再開していました(ref. [2008-09-01-5])。
図書館に行くためにたまたま前を通ったら
営業してたのに気づきました。
しばらく通ることがなかったからなあ。

Toshi Yoroizuka

- 鎧塚 俊彦の世界
  http://www.grand-patissier.info/ToshiYoroizuka/

ref.
- [を] 恵比寿の Toshi Yoroizuka がリニューアルオープンの気配
  [2008-09-01-5]
- [を] 東京ミッドタウンに移った Toshi Yoroizuka のお菓子を食す
  [2007-09-06-3]
- [を] Toshi Yoroizuka のケーキはうまい![2007-01-06-6]
cakecakecake
cakecake
(↑写真再掲)

たつをの ChangeLog
Powered by chalow