たつをの ChangeLog : 2008-01-22

第183回NL研に行ってきました。
昨日から二日間開催されているのですが、二日目だけ参加。

正式名称は:
- 情報処理学会 第89回情報学基礎研究会 第183回自然言語処理研究会
  合同研究発表会
  http://www.ipsj.or.jp/katsudou/sig/sighp/fi/cfp/20080121/

場所は竹橋の国立情報学研究所(NII)。
NIINII
NIINII

いくつかメモ。

■9. blog分類のための半教師有り学習
○池田大介,高村大也,奥村学(東京工大)
各blogのスタイルや内容といった情報を利用した,
blog分類のための半教師あり学習手法を提案する.
半教師有り学習でのブログ記事の分類。
少量のラベル付き事例を大量のラベル無し事例で補う。
大量の二値分類器(パーセプロトンベース)をかけて、
その結果の実数値ベクトルを入力としたSVMで最終的な分類を行う。
二値分類器では、
同じブログ筆者によるものは同じ「個性」を持つと仮定し、
同じブログの複数記事を正解事例とする。
どちらのブログに似ているかを二値で判定する。
最終的な分類では、
プロフィールありのヤフーブログを正解事例とし、
性別、年齢の推定で実験。

■10. 検索エンジン基盤TSUBAKIを用いた
大規模ウェブ情報クラスタリングシステムの構築
○馬場康夫,新里圭司.黒橋禎夫(京都大)
検索エンジンTSUBAKIを使って検索されたページを,
ページに含まれる複合名詞に注目して自動分類するシステムについて述べる.
ページ中の複合名詞に注目してWeb検索結果を自動的にクラスタリングする。
既存システムが検索結果のスニペットを利用しているのに対して、
TSUBAKI では全文を使っている。とのこと。
Recall はあがるであろう。
- 情報爆発プロジェクト 検索エンジン基盤 TSUBAKI
  http://tsubaki.ixnlp.nii.ac.jp/index.cgi

■14. Web情報を利用した確率モデルによる略語推定
○村山紀文,奥村学(東京工大)
与えられた語に対する略語推定を行う,Noisy-Channel modelと
Webからの情報を組み合わせた統計モデルを提案する.
名寄せ問題の一つとしての略語推定を行う研究。
「プレイステーション3」→「プレステ3」、など。
ルールベースではなく確率モデル。2段階のモデル。
略語候補の絞り込みは表層文字列情報から静的モデル。
「P(チャーリー|チャリー)」といった感じ。
最適解選択はコンテキスト情報などからの動的モデル。

動画ブログ「トーキョードリフト」(http://tokyodrift.jp/)、
新年第2回 (通算27回) は先日の Apple イベント[2008-01-19-4]
日本初登場(?)した MacBook Air です!
旬なネタなので、いつもの木曜ではなくちょっと早めにアップです。

Macworld 2008 ご報告会にtokyodrift侵入
画像

tokyodrift #27 (YouTube)


薄くて固いよー!
って、せんべいみたいだな。

今回のムービーは先日予告したやつです[2008-01-19-4]
ダイジェスト版はこちら:


必要にせまられて、何年ぶりかに TeX (latex) を使うことに。
前は Linux デスクトップマシンで使ってたのですが、
今回は Windows マシンで TeX ですよ。初めての経験。
とりあえず、定番情報源である下記を参考に。

- TeX Wiki
  http://oku.edu.mie-u.ac.jp/~okumura/texwiki/
- TeX installers for Windows - TeX Wiki
  http://oku.edu.mie-u.ac.jp/~okumura/texwiki/
  ?TeX%20installers%20for%20Windows


TeX インストーラ3ってのをインストール。手軽です。
今さらコマンドラインから操作ってのもアレなので (って、DOS窓じゃねえ)、
WinShell なる GUI を入れてみました。結構良い感じ。

- WinShell3 - TeX Wiki
  http://oku.edu.mie-u.ac.jp/~okumura/texwiki/?WinShell3

ということでサクサクと作業中です。
鋭意原稿執筆中。

で、まあ、はまりがちなのが図の挿入。
パワーポイントで作った図をなんとかして入れたくていろいろと苦労。
スライドを縦にして資料を作るか、スライドじゃなく「配布資料」として
出力するとかバッドノウハウ満載。

- PowerPoint図をきれいにTeXからPDFへ入れ込む方法
  http://keijisaito.info/arc/TeX/ve_ppfi_pdf.htm
- WMF2EPSのWindowsXPへのインストール
  http://www.nagao.nuie.nagoya-u.ac.jp/~kaji/utility/wmf2eps.html

結局、前者の方法でコツコツやりました。
なんで今時、eps をエディタで開いて Bounding Box の座標を
変更しなきゃならないんだよ。20世紀かよっ!
でも、図がそんなに多くないので特に面倒でもなかったですよ!><

パワポとTeXの話って、なんだかとってもデジャブな感じ。
検索してみたら4年前の記事が。当時は後者の方法でやってたのか。

- [を] PowerPoint から EPS ファイル[2003-02-01-1]

元祖 柿の種

2008-01-22-4 [FoodDrink]
浪花屋製菓株式会社の「元祖 柿の種」。
画像画像

としのり君 (http://overlasting.dyndns.org/) の新潟土産。あざーっす。
柿ピーとは違って柿の種だけ。
しかし、これがまた味付けが良いのですよ。
飽きない感じ。

- 元祖柿の種 浪花屋製菓株式会社
  http://www.naniwayaseika.co.jp/top/top-migi.html

たつをの ChangeLog
Powered by chalow