たつをの ChangeLog

8 件 見つかりました。

1 2 [ 次へ ]

ドメインの関係でしばらくアクセスできなかったMECAPI[2006-09-18-1]ですが、URLを下記に変更しました。よろしくお願いします(APIたたきすぎは勘弁なっ!)。

ttp://yapi.ta2o.net/apis/mecapi.cgi
追記180618: 負荷が厳しいため何年か前から停止中)

ついでに「笑い顔顔文字API」[2009-04-12-2]のURLも下記に変更。使ってる人いないと思うけど。

https://yapi.ta2o.net/apis/warosuapi.cgi

Yahoo!デベロッパーネットワークに「テキスト解析」が登場しました。
第一弾は日本語形態素解析APIです。
ヤフーのいろんなところに使われている WebMA という
形態素解析エンジンのAPIです。

- Yahoo!デベロッパーネットワーク - テキスト解析 - 日本語形態素解析
  http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html

MECAPI の仕様に似ていますが、まあそういうものです。
(MECAPI http://yapi.ta2o.net/apis/mecapi.cgi)

で、先日 MECAPI で作った「文で検索」[2007-04-03-1]
WebMA 版を作ってみました。「文で検索2」です。「2(ツー)」ですよ!

- 文で検索2 ttp://chalow.net/misc/bunsearch2.php
  http://yapi.ta2o.net/bundekensaku/
  (ソースはこちら: ttp://chalow.net/misc/bunsearch2.txt
    http://yapi.ta2o.net/bundekensaku/bunsearch2.txt

ちなみに MECAPI 版は ttp://chalow.net/misc/bunsearch.php
http://yapi.ta2o.net/bundekensaku/ で「MECAPI」を選択。
(ソースはこちら: ttp://chalow.net/misc/bunsearch.txt
  http://yapi.ta2o.net/bundekensaku/bunsearch.txt

ソースを見比べてみると分かると思いますが、
変更箇所は、MecapiWrods() の代わりに WebmaWords() を呼んでるところ
くらい。この二つの関数を違いを見てみて!(ま、ほぼ同じだけどね)

さて、MECAPI(MeCab) と WebMA の違いですが、なんといっても後者は
語彙が豊富です。ウェブに現れる語彙をじゃんじゃん追加しているので、
特に固有名詞なんかには強いです。

どちらかというとマイナーな苗字「小飼(こがい)」で比べてみましょう。
どちらも名詞だけ取り出しています。

- 文で検索 MECAPI版:小飼弾です
- 文で検索 WebMA版:小飼弾です

前者だと、「飼弾」という謎な語が取り出されてしまいます。
後者には、ちゃんと「小飼」という固有名詞が登録されていることが
分かります。


■関連記事:

- ヤフー、文章を解析できるAPI「日本語形態素解析Webサービス」を公開:
  ニュース - CNET Japan
  http://japan.cnet.com/news/media/story/0,2000056023,20351038,00.htm
ヤフーの日本語処理技術部がYahoo! JAPAN研究所と共同で開発を進めてき
た形態素解析エンジン「Web MA」を社外の開発者向けにAPIとして公開す
るもの。

- CodeZine:Yahoo!、異質なWeb API「日本語形態素解析Webサービス」を
  公開(Webサービス)
  http://codezine.jp/a/article/aid/1461.aspx
日本語文を形態素に分割し、品詞、読みがなの付与や、「文章内である
単語が何回使われたのか」といった統計情報を取ることができるWeb API。

献本いただきました。ありがとうございます。

加藤貴之, 佐久間勇樹, 関戸亮介, いわさきゆうだい / Web API実践リファレンスブック


幅広いジャンルのWeb APIが、それを使ったサンプルコードとともに
紹介されています。

なぜ献本していただけたのかというと、実はMECAPIが載っているのです。
ぜひぜひ使ってみてください。

- MECAPI - MeCab Web Service (MeCab API)
http://yapi.ta2o.net/apis/mecapi.cgi
-- サンプル: [を] PHPで自然文ヤフー検索を作ってみた[2007-04-03-1]

あと、つたないですがソースコードも公開しています[2007-04-01-1]
ソースは「無償・無保証・著作権放棄」(http://lifehacks.ta2o.net/byebye-copyright.html)
ですので、好き勝手に設置して使って下さい。改変、再配布もご自由に!


また、(MECAPIの中身である)MeCabの作者 taku-ku 氏による
128倍速MECAPI(C言語版)も最近公開されました。
フィルター機能がなかったりなど、完全に互換ではないのですが、
こちらもぜひ使ってみてください。

- きまぐれ日記: MECAPIを182倍高速にしてみた
  http://chasen.org/~taku/blog/archives/2007/05/mecap182.html
この記事に言及しているこのブログ内の記事

MECAPIのアクセス状況を調べたのでメモ。

調査データは 2006.10.5〜2007.4.17 (195日)のアクセスログ。

アク禁の分をのぞいて計算した平均値:
- 1日のアクセス数は472。
- 1日に送られてくる日本語文字数は9200文字。
  (1アクセスあたり20文字)
- 1日に返すXMLは533Kバイト。
  (1アクセスあたり1130バイト)

実際の値:
A. mecapi.cgi へのアクセス数(アク禁入り)。
B. mecapi.cgi へのアクセス数(アク禁にしているものをのぞく)。
C. 解析対象文の文字数合計(Bベース)
D. 返したXMLのサイズの合計(Bベース)

ABCD
Oct158701586528376724849762
Nov197119681008735811369
Dec9854855180694785
Jan103861038351824316353956
Feb9046904228907413487924
Mar447924476238471626017168
Apr35343957021908716663329

MECAPI[2006-09-18-1]のソースコードを公開。
きちんと書き直そうと思ってたんだけど、手抜きでそのまま公開します。

- MECAPI - MeCab Web Service (MeCab API)
http://yapi.ta2o.net/apis/mecapi.cgi
- ソースコード
http://yapi.ta2o.net/apis/mecapi.cgi?mode=code

サーバ負荷の問題があるので、大量にアクセス(例えば毎秒数回等)する
人は自分のサーバに設置して使って頂けると幸いです。
ソースは「無償・無保証・著作権放棄」(http://lifehacks.ta2o.net/byebye-copyright.html)
ですので、好き勝手に使って下さい。

設置方法:
(1) MeCabのPerlモジュールを入れる。
    see [を] MeCabをPerlから使う[2006-02-25-4]
(2) MECAPIのソースコードをWebサーバに置く。
(3) 動いた?

ref.
- サンプル:MECAPIのJSON出力で形態素解析
  http://chalow.net/misc/mecapi.html
- MECAPIに読ませろ!
  http://blog.livedoor.jp/dankogai/archives/50642090.html

1 2 [ 次へ ]

たつをの ChangeLog
Powered by chalow