たつをの ChangeLog

187 件 見つかりました。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 [ 次へ ]

NLP2024

概要


3月11日に神戸入り。
スポンサーイブニングに参加。
3月12日の午前にポスター発表。
午後からはスポンサーブースで説明&案内。
3月13日は総会と理事会。
終了後東京に戻る。

宿泊


三宮駅近くの「相鉄フレッサイン」に宿泊。
滞在中はスタッフに誰一人も会いませんでした。
立地が良い上に、室内も不満なし(ちょっと狭く感じたくらい)。
Wi-Fi は下り 60〜90Mbps くらいでぜんぜん問題なし。

交通機関


品川から神戸の往復は新幹線。
往路は富士山がきれいでした (ref. [2024-03-11-1])。

ホテルから会場へはポートライナーで10分ほど。
混む時間帯はそれなりに人が多いが乗れないほどでもなかったです。



ポートライナーの中に学会の案内がありました。
ポートライナー 学会案内

食事


神戸または関西ローカルのチェーン店、本店が神戸にある店に限定。
東京では見かけないお店を選びました。

ドンク 三宮本店。2階のカフェでやたら美味しいサンドイッチ(カスクートセット)。
DONQ 三宮本店 カスクートセット

ぎょうざの店 ひょうたん ミント神戸店。初日のスポンサーイブニング終了後、三宮に戻りさくっと一人飲み。
餃子 ぎょうざ ひょうたん

ホリーズカフェ 三宮駅前店。関西ローカルのカフェチェーンで店内がかなり広い。モーニングセットを頼みました。コーヒーが私好み!
ホリーズカフェ

かつ丼 吉兵衛 旭通店。神戸発祥のかつ丼専門店。サブメニューにそうめんがあり、物珍しくて注文。もちもちしてて、出汁も良い。カツ丼はカツ自体にしっかり味がついてて食欲そそる。
かつ丼 吉兵衛

デリカフェキッチン 三宮店。JR西日本が運営する駅カフェチェーン。店内広い。550円のモーニングセットがボリューミーで良い。コーヒーはなんというかミルク前提の味かな。
DELI CAFE KITCHEN

神戸ラーメン 第一旭 三宮本店。第一旭の暖簾分け神戸ローカルチェーン、なのかな。Bラーメンのランチセット。チャーシューたくさん。コショウが効いてる。夕食いらなくなるレベル。グッド!
神戸ラーメン 第一旭 三宮本店

その他


不動産に貼ってあったやつ。「小走り7分」というツッコミ待ち表記。
小走り7分

神戸滞在中、別途オンラインミーティングがあったので三宮の NewWork に行ったりもしました。全国どこでも変わらずな感じでした。安心感あり。

エスカレーターが東京と違って左空けだったので最初は戸惑いました。
この記事に言及しているこのブログ内の記事

2023年の春ごろ、Yahoo!デベロッパーネットワークのテキスト解析 Web API がひっそりと CORS 対応しました。簡単に言うと、ブラウザで開いたウェブページから直接 Web API を叩けるようになった、ということです。

API

テキスト解析 Web API の CORS 対応の概略は10月に LINEヤフー Tech Blog に書きました。概略というか単なるサンプルプログラム紹介です。Ajax な HTML ページや Chrome 拡張機能などの簡単なサンプルプログラムがあります。

  • テキスト解析 Web API を JavaScript から直接使う( API が CORS に対応しました) (LINEヤフー Tech Blog)
    最近のことですが、Yahoo!デベロッパーネットワークのテキスト解析 Web API の CORS(Cross-Origin Resource Sharing)対応が完了しました。 CORS についてはここでは解説はしませんが、本稿の観点からざっくり説明すると「別ドメインにあるウェブページ内の JavaScript プログラムからテキスト解析 Web API に直接アクセスして利用できるようになった」ということです。

    本稿では、サンプルコードでウェブページからテキスト解析 Web API に直接アクセスする方法を説明していきます。応用例として、Google Chrome 拡張機能のサンプルも紹介します。

もう一本、11月に LINEヤフー Tech Blog に書いた記事。サンプルプログラムから少しだけ踏み込んだサンプルプログラム(強)を紹介した記事です。テキスト解析 Web API の「校正支援」機能を使って、HTML ファイル一つで校正支援ツールを実現しています。

  • 1つの HTML ファイルだけで完結する校正支援ツールの作り方 (LINEヤフー Tech Blog)
    そのテキスト解析 Web API の機能の一つである「校正支援」は日本語文章の品質チェック(校正)を支援するもので、文字の入力ミス、言葉の誤用、わかりにくい表記、不適切な表現などが使われていないかをチェックして、指摘します(内部の辞書データをベースとしているため完全なものではないことをご承知おきください)。

    この校正支援機能のサンプルプログラムとして「HTML ファイル1つだけで完結する校正支援ツール」を作ったので紹介します。入力されたテキストに対する校正指摘をわかりやすく表示し、指摘箇所へのアクションを簡単に行える UI を持ち、特別なアプリやサーバを用意する必要がなく、Web ブラウザさえあれば今日からすぐに使える校正支援ツールとなっております。

ついでに再紹介。9月にリニューアルした個人サイト「テキスト変換(笑)」でも CORS 対応したテキスト解析 Web API を使っていますよ。


ということで、Yahoo!デベロッパーネットワークのテキスト解析 Web APIをぜひご利用ください。


API! API!
CORS! CORS!


今から約16年前に公開した「テキスト変換(笑)」ですが、このたびリニューアル公開しました!
新版はこちらです。


wara demo

テキストを入力して変換すると、ときどき「(笑)」が挿入された不謹慎でイラッとする文章ができあがります。どうぞご利用ください(笑)

  • 入力例:
    Web2.0で愛されモテカワスイーツな次世代ウェブサービスです。
  • 出力例:
    Web2.0(笑)で愛されモテカワスイーツ(笑)な次世代ウェブサービス(笑)です。

旧版は形態素解析に MeCab を使っていましたが、新版は Yahoo!デベロッパーネットワークテキスト解析 Web API の「日本語形態素解析」機能を使っています。

テキスト解析 Web API は最近 CORS 対応されまして、ブラウザで表示されるWebページの中から直接 API を呼び出して使えるようになったのです。自分のサーバに一切の負荷がかからないのがありがたいです。

過去記事


奈良先端科学技術大学院大学松本研究室の30周年記念同窓会でした。
新型コロナの影響で松本先生の退官記念イベントができなかったのでそれも兼ねて。

松本研 30周年 松本研 30周年

せたがやがやがや館にて。
久しぶりに会えた人たくさんで楽しかったです!

15年前に書いた記事のリニューアル版です。


前回と同様、bigram language model に基づく、ランダム文生成を行います。
ある単語の次に現れる単語の分布を用いて、文章を生成していくだけです。

形態素解析(日本語の単語の認識)は、Yahoo!デベロッパーネットワークのテキスト解析 API の日本語形態素解析 (V2) を使います。

ベースとなるテキストデータは「日本国憲法」(nkkp.txt) を使います (ref. [2023-06-07-1])。
プログラム mamarkov-build.pl で、テキストデータ (nkkp.txt) を形態素解析し、「ある単語の次に現れる単語の分布」を計算し、データファイル (mamarkov-sample.tsv) に出力します。


実行コマンド:
cat nkkp.txt | ./mamarkov-build.pl > mamarkov-sample.tsv

ファイル:
wc -l nkkp.txt
    224 nkkp.txt

tail -1 nkkp.txt
但し、この憲法によって、後任者が選挙又は任命されたときは、当然その地位を失う。

wc -l mamarkov-sample.tsv
    868 mamarkov-sample.tsv

head mamarkov-sample.tsv | tail -3
あれば  、      、      、      、
い      ない
いかなる        特権    差別    奴隷    宗教    宗教    場合

mamarkov-sample.tsv には
  • 「あれば」のあとには「、」しか現れない(4回)
  • 「いかなる」のあとに続く単語は「宗教」が2回、「特権」「差別」「奴隷」「場合」が1回ずつである
などの統計情報(日本国憲法のテキストの)が格納されています。

このデータファイル (mamarkov-sample.tsv) を用いて、プログラム mamarkov-gen.pl で新たなテキストを生成します。
そのロジックは「RSS を読み込んでランダムな文章を生成する[2008-09-07-3]」で解説しているものと同じです。


実行コマンド:
cat mamarkov-sample.tsv | ./mamarkov-gen.pl

出力例:
配偶者の国民の原理に、これを証拠とが欠けたときは、及び団体は、この憲法第二以上の多数でこれを、これを選任する。

但し、又は一部の自由を委任ができる。

信教の議事機関は、社会的、国会を有する終審と異なった議決にも、個人の安全とする。

財産は、及び法律の下に保障及び残虐な刑罰を失う。

何人も、国務大臣は、一般行政機関が日本国民は、内閣は、可否同数の全部又は法律の目的を経なければならない。

関連記事


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 [ 次へ ]

たつをの ChangeLog
Powered by chalow