たつをの ChangeLog
: 2008-01-10
前後の日:
2008-01-09
< >
2008-01-11
この月:
2008-01
別の年の同じ日:
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2012
2013
2014
2015
2016
2017
2018
2019
2020
2023
5分で身につく! 超売れ筋ビジネス書101冊
2008-01-10-1 [
BookReview
]
読んだから、ということで頂きました。ツイてる!
■
神足裕司 / 5分で身につく! 超売れ筋ビジネス書101冊
有名ビジネス本を図解しているムックです。
TOPPOINT
もそうですが、
さくっと概要が分かるってのはありがたいですよね。
101冊のうち、私が読んだことのあるものは30冊でした。
ロングセラーものの既読率は高いのですが、
新しめのものに関しては低すぎ。
今年は新しいものもさくさく読んでいきたいな。
この記事に言及しているこのブログ内の記事
2008 年 1 月に読んだ本 (2008-01-31)
WikipeJaGo の人名抽出部分を修正
2008-01-10-2 [
Programming
][
Maintenance
]
Wikipedia 日本語版のXMLデータからキーワードを抽出するツール群
「WkipeJaGo」
[2007-12-30-1]
をアップデートしました。
- /lang/perl/misc/wikipejago - CodeRepos::Share - Trac
http://coderepos.org/share/browser/lang/perl/misc/wikipejago
人名を取り出すスクリプト (ext-wpj-person.pl) は、
今までは日本人の名前だけを対象としていたのですが、
その制限を取り払いました。
うまく抽出できてるっぽかったので CodeRepos にコミット。
最初からこれでよかったかも。
なお、Wikipedia にはいろんなものの一覧ページ
[2007-11-27-1]
があり、
そこには様々なカテゴリの人名一覧ページもあります。
しかし、フォーマットがいろいろあるのでそこから人名を抽出するのは
ちょっと手間です。一覧を一つ一つ見ていかなくちゃならないので。
そんなわけで、ext-wpj-person.pl は Wikipedia の全データ (XML) を
スキャンして人名を取り出すという、一見無駄なロジックを採用しています。
時間はかかりますが、下記で30分くらいなので、
それほど問題にならないレベル。
bunzip2 -c jawiki-latest-pages-articles.xml.bz2 | ./ext-wpj-person.pl
それに実装がむちゃくちゃシンプルになるしね!
前後の日:
2008-01-09
< >
2008-01-11
この月:
2008-01
別の年の同じ日:
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2012
2013
2014
2015
2016
2017
2018
2019
2020
2023
たつをの ChangeLog
Powered by
chalow