たつをの ChangeLog : 2007-06-18

Yahoo!デベロッパーネットワークに「テキスト解析」が登場しました。
第一弾は日本語形態素解析APIです。
ヤフーのいろんなところに使われている WebMA という
形態素解析エンジンのAPIです。

- Yahoo!デベロッパーネットワーク - テキスト解析 - 日本語形態素解析
  http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html

MECAPI の仕様に似ていますが、まあそういうものです。
(MECAPI https://maapi.net/)

で、先日 MECAPI で作った「文で検索」[2007-04-03-1]
WebMA 版を作ってみました。「文で検索2」です。「2(ツー)」ですよ!

- 文で検索2 ttp://chalow.net/misc/bunsearch2.php
  http://yapi.ta2o.net/bundekensaku/
  (ソースはこちら: ttp://chalow.net/misc/bunsearch2.txt
    http://yapi.ta2o.net/bundekensaku/bunsearch2.txt

ちなみに MECAPI 版は ttp://chalow.net/misc/bunsearch.php
http://yapi.ta2o.net/bundekensaku/ で「MECAPI」を選択。
(ソースはこちら: ttp://chalow.net/misc/bunsearch.txt
  http://yapi.ta2o.net/bundekensaku/bunsearch.txt

ソースを見比べてみると分かると思いますが、
変更箇所は、MecapiWrods() の代わりに WebmaWords() を呼んでるところ
くらい。この二つの関数を違いを見てみて!(ま、ほぼ同じだけどね)

さて、MECAPI(MeCab) と WebMA の違いですが、なんといっても後者は
語彙が豊富です。ウェブに現れる語彙をじゃんじゃん追加しているので、
特に固有名詞なんかには強いです。

どちらかというとマイナーな苗字「小飼(こがい)」で比べてみましょう。
どちらも名詞だけ取り出しています。

- 文で検索 MECAPI版:小飼弾です
- 文で検索 WebMA版:小飼弾です

前者だと、「飼弾」という謎な語が取り出されてしまいます。
後者には、ちゃんと「小飼」という固有名詞が登録されていることが
分かります。


■関連記事:

- ヤフー、文章を解析できるAPI「日本語形態素解析Webサービス」を公開:
  ニュース - CNET Japan
  http://japan.cnet.com/news/media/story/0,2000056023,20351038,00.htm
ヤフーの日本語処理技術部がYahoo! JAPAN研究所と共同で開発を進めてき
た形態素解析エンジン「Web MA」を社外の開発者向けにAPIとして公開す
るもの。

- CodeZine:Yahoo!、異質なWeb API「日本語形態素解析Webサービス」を
  公開(Webサービス)
  http://codezine.jp/a/article/aid/1461.aspx
日本語文を形態素に分割し、品詞、読みがなの付与や、「文章内である
単語が何回使われたのか」といった統計情報を取ることができるWeb API。

夢ひよこ

2007-06-18-2
ふわふわコロコロしててかわいい!
ちょっと気になる。

夢ひよこ


ref.
- ひよ子チョコ[2006-05-29-5]
- ひよ子サブレー[2005-09-28-1]
- 銘菓「ひよこ」 http://nikki.chalow.net/19991004.html
この記事に言及しているこのブログ内の記事

なぜ「千円札は拾うな」なのかというと、
「千円札を拾うと目線が下がり、他のものが見えなくなるから」、
とのこと。
目先の小さな利益よりももっと価値のあるものに目を向けよう、ということでしょうね。

安田佳生 / 千円札は拾うな。


以下、読書メモ。もりだくさんかも:

優秀な人材には仕事をさせない、という話 (p.28)。
優秀な人にたくさんの仕事をさせると、こなしてくれはするけど、それだけで終わってしまう。
優秀な人の最も大切な能力は「新しいものを生み出す能力」なのだから、自由な時間を与えて、新しいものを出してもらうのが吉。
大企業に埋もれている優秀な人の話を思い出した。

自分でできることは自分でしない、という話 (p.36)。
やる人によって生産性があまり変わらないことは外注せよ、と。
私から補足すると、外注するときは、なるべく「やれば自分でもできること」を外注するべきだと思います。外注での成果をきちっと検証するために。

ビジネスは、頑張って努力して百メートルを九・五秒で走るより、全く別の方法で百メートルを五秒で移動した者が勝つ世界なのだ。
(p.40)
「研究さん」(http://0xcc.net/misc/kenkyu-san.html)を思い出しました。
どの世界でも、ひらめき・アイディアで努力を回避するのが最強ですね。

売り上げを伸ばすために「嫌な」顧客を捨てる、という話。
嫌なお客一割を断ると結果的に売り上げが増える、と。
 お客の一割を断るのだから、売り上げも一割落ちると思われるだろうが、実際にはそうではない。実際にやってみるとわかるが、残りの九割の会社だけで九十五%前後の売り上げになる。
 なぜ一割下がらないのかというと、現実にはいちばんうるさい客が、いちばん儲からない客だからだ。(p.44)

電車には乗らず常にタクシーで移動している理由。
 本当は電車のほうが時間も早く正確なうえ、値段も安い。それでも私があえてタクシーを使っているのは、電車に乗ると心がすさむからだ。
 電車に乗ると必ずマナーの悪い人を目にして腹を立てることになるし、混んでいると足を踏まれたり寄りかかられたりと、嫌な思いもする。さらにその人が臭かったり、不潔だったりすると、一日中気分が悪くなって仕事のテンションまで下がってしまう。 (p.86)
前は、会社に着くころにはへろへろだし、帰宅するとぐったり。
しかし、会社から二駅のところに引っ越してからはあまり心がすさまなくなってツイてる!

変化できる人、できない人。その差は…
 私は「捨てられるものの量の違い」だと思う。なぜなら変化するということは、それまで持っていたものを捨て、新しいものを受け入れるということだからだ。
 つまり、「捨てられるものの量」がその人の「変化値」を決めているということだ。(p.107)
少物主義!捨てちゃえ!捨てちゃえ!

たつをの ChangeLog
Powered by chalow