たつをの ChangeLog : 2008-08-03

「Introduction to Information Retrieval」の輪講の第12回です。

- Introduction to Information Retrieval
http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html

今回は初台のDeNAの会議室を使わせて頂きました。
ありがとうございました。
DeNA

最初に恒例の「前章の復習 by id:naoya」
(http://d.hatena.ne.jp/naoya/20080803/1217775535)。

そして、今回は第11章「Probablistic information retrieval」。
この章は、確率・統計の話がメインです。
これから後の章ではそういう話がいろいろと出てくるので基礎固め。

お知らせ:

ついに書籍版が出ました!
私はまだ未入手。来週にはゲットできるかと。

Introduction to Information Retrieval


関連情報:

- キーワード抽出: tf-idf の意味づけ (きまぐれ日記)
http://chasen.org/~taku/blog/archives/2005/11/_tfidf_1.html
tf-idf は、単なるヒューリスティックスだと考えられていましたが、最近言語モデルに基づく情報検索手法がさかんに研究されるようになり、tf*idf の解釈が明らかになってきました。
確率と tfidf の話。

今日紹介した書籍:

Toby Segaran (著), 當山仁健, 鴨澤眞夫 (訳) / 集合知プログラミング

(ref. [2008-07-22-3])
ナイーブベイズや検索ランキングなど。

荒木雅弘 / フリーソフトでつくる音声認識システム - パターン認識・機械学習の初歩から対話システムまで

(ref. [2007-10-09-4])
ベイズ判定法や統計的言語モデルなど。

誰でも閲覧できるけど、編集は限られた人だけにしたい。
ユーザ登録などの面倒なことはなしで、パスワードを知っている人ならば誰でも編集できる、くらいの制限。
簡易なCMSとして使いたい。

Hiki (Ruby で書かれた Wiki エンジンの一つ) だと、できたページの編集権限などは設定できるけど、誰でもページの作成はできてしまう。
これじゃあ使えない。
で、新しいやつだとできるようになってるかなと思って、インストールして確認してみた。
結論から言うと、そういうことはできなかった。
設定項目もなさげ。
あきらめ。

追記: 管理系CGIをベーシック認証領域に置くのを作った。後日整理する。 http://yattane.sakura.ne.jp/wiki/

§

- Hiki
http://hikiwiki.org/ja/

現在の最新バージョンは 2007-06-24 リリースの 0.8.7。

- Hikiについて
http://hikiwiki.org/ja/about.html
アクセス制限が可能
管理者だけがページを編集できるようにページを凍結することや、あらかじめ登録したユーザだけに編集を許可するといったアクセス制限ができます。

さくらのレンタルサーバへインストールするときのはまりどころ:
「.htaccess」中の下記がエラーになるので削除する。
Options +ExecCGI

たつをの ChangeLog
Powered by chalow