たつをの ChangeLog : 2007-09-03

Web上のテキストデータをコーパスとして見る、
というテーマでブログ記事を書いています。
今回は手前味噌ながら EReK (http://erek.ta2o.net/)を取り上げます。

なお、この記事は「三省堂辞書サイトのブログ」へも転載という形で
提供しています。そちらでもお楽しみ下さいませ。

- ウェブコーパス徹底活用 第二回「英語例文検索 EReK」」
- Sanseido Word-Wise Web [三省堂辞書サイト]
http://dictionary.sanseido-publ.co.jp/wp/

§

■ウェブコーパス徹底活用 第二回「英語例文検索 EReK」

ウェブ検索で英単語や英語表現を検索し、
実際の使われ方を調べるという行為は、
ウェブ検索が登場した当初から盛んでした。
私も90年代中ごろ、英語論文と格闘するときによくやってました。

それを思い出して私が作ったサービスが
「英語例文検索 EReK」(http://erek.ta2o.net/)です。

米 Yahoo! が提供している Web API (ウェブ検索API)を使っています。
ウェブ全体を巨大な一つのコーパスとみなして、
入力された英語表現(キーワード)の実際の使われ方を提示するサイトです。

実際の検索例を挙げておきます。"made from" で調べた結果です。
なお、ブラウザの幅は「最大」にして使うことをオススメします。

画像

EReK のポイントは二つあります。

まず一つめは、KWIC と呼ばれる表示方式です。
KWIC とは "KeyWord In Context" の略で、
中心に検索キーワード、左右に前後の文脈(コンテキスト)を配置することで、
複数の用例を見やすく並べることができます。
コーパス検索システムでよく採用されているインタフェースで、
言語の使われ方をブラウズするのに非常に便利です。

EReK ではキーワードの前後のコンテキストをそれぞれアルファベット順に
ソート(並び替え)でき、類似のコンテキストをまとめることができます。
「キーワードの後ろにどんな単語が来やすいのか」だけでなく
「キーワードの後ろにこの単語が来たら、次にどんな単語が来やすいのか」
といった要求にも答えることができます。

もう一つのポイントは、検索範囲の指定です。
例えば、医学系の単語・表現ならば、医学関連の英語サイトの中から
用例を検索すればノイズも減って良いですよね。

EReK では、将来はこのようなことができるように、
ユーザによる検索範囲指定カスタマイズ機能を用意する予定なのですが、
現在は未提供です。
そのかわり、最低限の範囲指定機能として、
下記の三つの中から選択できるようにしています。

(1) ウェブ全体、
(2) edu ドメイン(教育機関など)のサイトのみ、
(3) ニュースサイト(CNN,ABCなど)のみ。

ウェブ全体だと検索する表現によってはネイティブでない人のテキスト
がほとんどだったりすることもあります。
適宜選択して活用していただけると良いかと思います。

以上、EReK の二つのポイントでした。

ところで、先日、日本で働いている英語圏の方に意見をうかがったところ、
「日本語版も作って欲しい!私にとってはそっちの方が必要!」
との要望を頂きました。
カスタマイズ機能もそうですが、
じわじわと実装していきたいと思っておりますので、
今後ともよろしくお願いします。

次回も EReK のようにウェブ検索機能を活用した便利ツールを紹介します。

2ちゃんねるのスレをまとめて本にしたっぽい「2ちゃんねる新書」
が創刊されましたね。実物は見てないけど、会社の近くのビルに
大きな看板が出ていたので知った次第。
2ちゃんねる新書

嗚咽 (2ちゃんねる新書)


恥ずかしくて死ぬかと思った体験 (2ちゃんねる新書)


自分がスケベだと思う瞬間 (2ちゃんねる新書)


朝勃ち時の排尿方法 (2ちゃんねる新書)


アツアツご飯に何を乗っけて「わしわし」する? (2ちゃんねる新書)


UMINE〜ウミネ〜
http://www.takaratomy.co.jp/products/umine/

ちょっと話題の「ウミネ」。
天井に、水面っぽいのを映し出したりできる癒し系のガジェットみたいです。
プレゼントとかにうってつけかも。
かなり気になるのですが、なんかどこも品切れみたいですね。

タカラトミー / ヒーリングシアター ウミネ


追記070912: ↑amazon で、11月11日入荷予定、と一瞬出てました。
しばらく待たないとダメっぽいですねえ。
この記事に言及しているこのブログ内の記事

ITmedia Biz.ID の
「3分LifeHacking:続々・本のページを開いたまま固定する」
(http://www.itmedia.co.jp/bizid/articles/0709/03/news050.html)
という記事で携帯可能なブックスタンドが紹介されていました。

ほんたった


私の場合は、二つ折りケータイを使って本を開いたまま固定するのが常です。
余計な道具がいらないのが嬉しい

画像画像
- [を] ブックストッパーよりもケータイ[2006-10-22-3]
- [を] LifeHacks 楽しく効率よく仕事する技術[2006-12-24-5]

しかし、最近ケータイを変えたのですが[2007-08-10-1]、新しいケータイ (Soft Bank 913SH) はスライド式なので、その技が使えなくなってしまってちょっと困っています。どうしたものかなあ…。
913SH FULLFACE

たつをの ChangeLog
Powered by chalow