たつをの ChangeLog

176 件 見つかりました。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 [ 次へ ]

3月17日(火)から言語処理学会の年次大会が始まりました。
茨城大学での開催予定だったのですが、COVID-19 の影響でオンライン開催となっています。

NLP2020

学会としては初の試みだし、私もオンラインでのこういう大会の参加は初体験。
基本ツールは Zoom です。

各セッションは Zoom の各部屋に割当られており、進行は座長が仕切ります。
発表者は時間になったら遠隔で。
他の聴衆が見えないので発表者は手応えないかも。
聞いている人も慣れない感じ。

ポスターセッションは、各ポスターごとに Zoom 一部屋。
むしろこっちの方が見やすいし聞きやすいし良いかも。
誰が聴きに来ているかも表示されているので賑わいも分かる。

学会のオンライン大会は今後ひろがっていくと思うので、それを早いうちに体験できてよかったです。
って、明日も明後日もあります。

形態素解析器 MeCab の WebAPI である MECAPI
その MECAPI を Linux や macOS などのターミナルから使うためのコマンドを用意しました。
Perl で書いた超簡単なやつです。


使い方は API に準拠 (ref. http://maapi.net/apis/mecapi)。
response, filter, format, dic はオプションで指定。
sentense (解析対象文) は標準入力で。

実行例:
% echo 'ここは六本木ヒルズです' | mecapi.pl -format json -dic neologd | jq .
[
  {
    "feature": "名詞,代名詞,一般,*,*,*,ここ,ココ,ココ",
    "surface": "ここ"
  },
  {
    "feature": "助詞,係助詞,*,*,*,*,は,ハ,ワ",
    "surface": "は"
  },
  {
    "feature": "名詞,固有名詞,一般,*,*,*,六本木ヒルズ,ロッポンギヒルズ,ロッポンギヒルズ",
    "surface": "六本木ヒルズ"
  },
  {
    "feature": "助動詞,*,*,*,特殊・デス,基本形,です,デス,デス",
    "surface": "です"
  }
]
(JSON を扱うには jq がすごく便利!)

エラーが出る場合、中で使っている Perl モジュール "LWP::Simple" で https へのアクセスができないことが原因かも。
そのときは、 "LWP::Protocol::https" を入れて見てください。
"perl lwp::simple https" などでネット検索!

それができない、とか、それでもダメといった場合は代わりに mecapi-curl.pl をご利用ください。
こちらは最小構成の perl と curl が入っていれば動きます。
単なる curl のラッパーです。

以上です。
ぜひ、MECAPI をお楽しみください!

追記191212: 一文ずつ渡すだけならば普通に curl だけOKです!
curl https://maapi.net/apis/mecapi -s --data format=json --data-urlencode sentence=六本木ヒルズです

関連記事


MECAPI という形態素解析 API を運営しているのですが、ここしばらくはレンタルサーバの負荷がきついので実質まったく動いていない状態でした(というか停止していた)。

「これじゃいけない!」ということで、AWS 上で MECAPI を運用していくことにしました。
クラウドな MECAPI です。

URLも新しくなりました。
説明ページ(トップページ)も作りました。
どうぞご利用ください。

mecapi 仮ロゴ
  • 形態素解析API「MECAPI」
    MECAPIとは、 日本語形態素解析器 MeCab の Web Service (API) です。
    API を無償で提供しております。
    後述の注意点をお読みいただいた上で、ご自由にお使いください。

1週間くらい前から真面目にAWSをいじり始めたのですが、かなり良いですね(今更)。
練習でウェブサーバを立ち上げたりしてましたが、手順は多いけど難しくはないです。
なんだかんだで最後までできてしまいます。
やはり時代はクラウドだなあ。

MECAPI での形態素解析処理(MeCab とその Perl Module)は当面はインスタンス1つだけでまかなうつもり。
ロードバランサーの設定もしたので、負荷がきつくなったらインスタンスを追加すれば大丈夫なはず(今はLBにインスタンスが一つだけぶらさがっている状態)。
そこらへんは追々に。

AWS の料金ですが、私が運営しているKindleセール情報サイト「キンセリ」の収入の一部を使っていくつもりです。
まずは、月10万円くらい($1,000)が上限(アラート設定済み)。
どれくらいかかるかはやってみなくちゃわからないけど。
運用状況については今後定期的に報告していく所存です。

過去記事

この記事に言及しているこのブログ内の記事

Google謹製の「音声文字変換」アプリを Android で試してみました。
リアルタイムで音声を文字起こししてくれるアプリです。

音声文字変換アプリ Android

起動するとすぐに音声認識&文字変換がスタートします。
認識したらどんどんその場で文字になっていきます。



しばらくしゃべり続けて文脈情報が増えると、最初の認識結果が再変換されたりして、賢さを感じます。

動画の例だと、
  • 1. 「ロンドン」
  • 2. 「ロンドン喋っていくと」
  • 3. 「どんどん喋っていくと」
と変わっているのがわかります。

あと、「まあ」とか「あー」とかの短めなフィラーは無視してくれるのはありがたいですね(長いと残る)。

音声文字変換

教科書の詩を朗読しました。
とらちゃん(小3息子)も同時に読んでいたので、間に変なの(「私」の重複とか)が入ったり。
複数の人間がしゃべっていると混ざるのは仕方ないですね。
そして息子は案の定、下品な言葉を乱発して困ります。
画面では「笑い声」というメタ情報も表示されていますね。
そういうが面白いお年頃なのです。

音声文字変換アプリ Android

テレビのニュースを文字化。
十分実用的ですね。
「グエン容疑者」が「文容疑者」になっていますがこれはやむなし。

音声文字変換

現時点での結論:完璧なものではないですが非常に使いやすくてとても良い

参考


名古屋で開催中の言語処理学会年次大会2019に参加。

%u540D%u53E4%u5C4B%u5927%u5B66


3月12日(火)10:30-チュートリアル
17:00-スポンサーイブニング
3月13日(水)9:00-本会議 第1日(午前 招待講演1,午後 25周年企画)
19:00-懇親会
3月14日(木)9:00-本会議 第2日 (午前 招待講演2)
3月15日(金)9:00-本会議 第3日

名古屋大学に来るのは初めて。
市中心部からは地下鉄で楽々。
大学に地下鉄駅ができたのは今世紀になってから。

%u540D%u53E4%u5C4B%u5927%u5B66 %u540D%u53E4%u5C4B%u5927%u5B66 %u540D%u53E4%u5C4B%u5927%u5B66 %u540D%u53E4%u5C4B%u5927%u5B66

豊田講堂でチュートリアル(3/12)。

%u8C4A%u7530%u8B1B%u5802%20%uFF08%u540D%u53E4%u5C4B%u5927%u5B66%uFF09
%u8C4A%u7530%u8B1B%u5802%20%uFF08%u540D%u53E4%u5C4B%u5927%u5B66%uFF09 %u8C4A%u7530%u8B1B%u5802%20%uFF08%u540D%u53E4%u5C4B%u5927%u5B66%uFF09 %u8C4A%u7530%u8B1B%u5802%20%uFF08%u540D%u53E4%u5C4B%u5927%u5B66%uFF09 %u8C4A%u7530%u8B1B%u5802%20%uFF08%u540D%u53E4%u5C4B%u5927%u5B66%uFF09

スポンサーイブニング(3/12)。
大盛況。

%u30B9%u30DD%u30F3%u30B5%u30FC%u30A4%u30D6%u30CB%u30F3%u30B0 %u30B9%u30DD%u30F3%u30B5%u30FC%u30A4%u30D6%u30CB%u30F3%u30B0

本会議1日目(3/13)。
IB大講義室でオープニングと招待講演。

NLP2019%20%u30AA%u30FC%u30D7%u30CB%u30F3%u30B0%u30BB%u30C3%u30B7%u30E7%u30F3 NLP2019%20%u30AA%u30FC%u30D7%u30CB%u30F3%u30B0%u30BB%u30C3%u30B7%u30E7%u30F3 NLP2019%20%u62DB%u5F85%u8B1B%u6F14 NLP2019%20%u62DB%u5F85%u8B1B%u6F14

総会に参加(3/13)。
お弁当が出ました。
ごちそうさまでした。

%u304A%u5F01%u5F53

25周年企画(3/13)。
言語処理学会年次大会の25年を振り返る。
IB大講義室でやってたのを、IB014で中継で見ました。

NLP2019

口頭発表。
人がいっぱいで入れない部屋もあり。

NLP2019
NLP2019 NLP2019

言語処理飲み会(NLP飲み会)。
懇親会の二次会として毎回有志で開催される飲み会。
「ビアホール BardenBarden 栄店」にて。
懇親会は参加者多数で申し込めなかったので今回の飲み会はこれだけ。
参加者多くて大盛況、100人以上居たかと。
飲み会中の写真は撮り忘れました。

%u30D0%u30FC%u30C7%u30F3%u30D0%u30FC%u30C7%u30F3%20%u6804%20%u540D%u53E4%u5C4B

本会議2日目(3/14)。
IB大講義室で招待講演。
別室で中継でみる。

NLP2019

ポスターセッション。
人多いです。

NLP2019%20%u30DD%u30B9%u30BF%u30FC%u30BB%u30C3%u30B7%u30E7%u30F3
NLP2019%20%u30DD%u30B9%u30BF%u30FC%u30BB%u30C3%u30B7%u30E7%u30F3 NLP2019%20%u30DD%u30B9%u30BF%u30FC%u30BB%u30C3%u30B7%u30E7%u30F3

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 [ 次へ ]

たつをの ChangeLog
Powered by chalow