古い記事
ランダムジャンプ
新しい記事
Web上のテキストデータをコーパスとして見る、
というテーマでブログ記事を書いています。
今回は英文校正サイト NativeChecker を取り上げます。

なお、この記事は「三省堂辞書サイトのブログ」へも転載という形で
提供していますので、そちらでもお楽しみ下さい。

- 第三回「英文校正サイト NativeChecker」
- Sanseido Word-Wise Web [三省堂辞書サイト]
  http://dictionary.sanseido-publ.co.jp/wp/

ちなみに Sanseido Word-Wise Web によれば、明日19日は、
子供向けかと油断すると結構エグいサバイバル小説「蝿の王」[2004-06-15-4]
著者ウィリアム・ゴールディングの生誕日だそうです。

§

■ウェブコーパス徹底活用 第三回「英文校正サイト NativeChecker」

今回は、英作文に役立つ英文校正ツールの紹介です。

英作文で一番やっかいなのは on, with, for, of などの前置詞です。
受験勉強で散々やった超基本的な表現でもときどき悩んでしまいます。
例えば「木製」の訳が「made of wood」なのか「made from wood」なのかなど。

こういうときはウェブ検索サイトが便利で、
前置詞を置き換えたパターンで次々と検索していけば、
検索ヒット数で確からしさが分かります。
しかし、「of」か「from」かなどの二択ならともかく、
候補が曖昧なときには試行回数が増え、
どう考えても面倒くさいです。

このような作業を自動化したのが、
浜本階生さんによる「NativeChecker」です。

英文校正サイト [NativeChecker]
http://native-checker.com/

前置詞だけでなく、
スペルミスや時制などの文法チェックや、
類義語の提示なども行ってくれます。
今年の春から夏にかけて開催された、
Yahoo!JAPAN WEB APIコンテストで賞を取っているすぐれものです。

基本的な使い方を簡単に説明しておきます。
入力サンプルにもある "made by wood" で見てみましょう。
「made by wood」と入力すると、
ウェブでの出現頻度と、
「made (過去分詞) by (前置詞/従属接続詞) wood (名詞(単))」と
品詞が振られてものが表示されます(スペルミスがあれば波線が引かれます)。

ここで、
前置詞の部分を様々なバリエーションに換えて出現頻度を調べたい場合、
「by」をクリックして出てくるメニューで「その他の表現」を選択します。
すると図1のように、
いろいろな前置詞によるパターン(とその出現頻度)が表示されます。

画像

また、
「made」をクリックすると、
「類義語」や「活用形」などのバリエーションが選択できます。
図2は、made の類義語を展開したパターンで出現頻度を調べたものです。

画像

ウェブでよく現れる表現ほど自然な英語表現に近いとみなす、
つまり、ウェブをコーパスとみなすことにより、
ここまで便利なツールができてしまうとは驚きです。
可能性のある英語表現を片っ端から自動で調べてみるという大胆な方法が、
この用途にぴたっとはまっていますね。
この記事に言及しているこのブログ内の記事