もしかしてXXX
2004-10-17-1
Googleの「もしかしてXXX」
<http://airoplane.net/archives/001264.html>
(via <http://dkiroku.com/2004-10-16.html#2004-10-16-8>)
スキャンするなんて負荷のかかる処理するかなあ。単に gogle と
(文字列的に)類似した語を単語リストから取ってくるだけかと。
Modern Information Retrieval (Acm Press Series)
<http://airoplane.net/archives/001264.html>
(via <http://dkiroku.com/2004-10-16.html#2004-10-16-8>)
まず最初にGoogleは、「gogle」の検索結果を返します。次に、検索結果いくらなんでもこんな遠回りなことはしないと思います。テキストを
のテキストと文書間類似度が高いテキストを用意します。そしてその用意
したテキストから、「gogle」と単語の表記類似度が高い語を探します。
おそらく似たテキスト内で「gogle」と似た言葉といえば、「Google」と
なるでしょう。そして最後に「gogle」と「Google」のDFを比べ、google
のほうが一般的な言葉だった場合に「もしかして Google?」と表示しま
す。
スキャンするなんて負荷のかかる処理するかなあ。単に gogle と
(文字列的に)類似した語を単語リストから取ってくるだけかと。
Modern Information Retrieval (Acm Press Series)
この記事に言及しているこのブログ内の記事