古い記事
ランダムジャンプ
新しい記事
お笑いパソコン日誌(2005/12/7)より、「韓国出張」でWeb検索すると検索結果が「子供はダメよ」的なことになっているというネタ。
http://www2s.biglobe.ne.jp/~chic/pilot.html


検索精度向上を考えたとき、こういうのはどうしたら良いのかなあ。
結局フィルタリング機能でしょうか。

フィルタリング機能と言えば、Yahoo!のWeb検索APIでは adult_ok というパラメータで検索結果からこの種のコンテンツを排除するか否かが指定できるという仕様になっています。デフォルトでは「含まない」になっていて、 1 に設定すれば含むようにできます。
http://developer.yahoo.co.jp/search/web/V1/webSearch.html

ただ、「韓国出張」の例で試してみたところ日本語ページでは現在はあまり機能していないようです。
(例1)含む http://search.yahooapis.jp/WebSearchService/V1/webSearch?^
appid=YahooDemo&query=%e9%9f%93%e5%9b%bd%e5%87%ba%e5%bc%b5&adult_ok=1
(例2)排除 http://search.yahooapis.jp/WebSearchService/V1/webSearch?
appid=YahooDemo&query=%e9%9f%93%e5%9b%bd%e5%87%ba%e5%bc%b5


ともかく今後これらの機能が重視され、性能も向上して行くでしょう。
実際やってるけど、まだ表のサービスには出していない、という状況なのかもしれません。なんにせよ早期実用化が待たれます。

フィルタリングってどんなやり方があるかなあ、ということでいくつか:
  • 担当者が人手でこつこつレイティング
  • ソーシャルネット的な方法でレイティング
  • アダルトコンテンツとの関連(リンク)の利用
  • 自然言語処理技術の利用
  • 画像情報で判定