古い記事
ランダムジャンプ
新しい記事
UTF-8の文字にマッチする正規表現の素直版。
レガシーなのに対応するとき用にメモ。

[\x00-\x7f]|[\xC0-\xDF][\x80-\xBF]|[\xE0-\xEF][\x80-\xBF]{2}|[\xF0-\xF7]
[\x80-\xBF]{3}|[\xF8-\xFB][\x80-\xBF]{4}|[\xFC-\xFD][\x80-\xBF]{5}

123456
0xxxxxxx
110xxxxx10xxxxxx
1110xxxx10xxxxxx10xxxxxx
11110xxx10xxxxxx10xxxxxx10xxxxxx
111110xx10xxxxxx10xxxxxx10xxxxxx10xxxxxx
1111110x10xxxxxx10xxxxxx10xxxxxx10xxxxxx10xxxxxx

追記060311: もっと短くても良いそうです。
[\x00-\x7f]|[\xC0-\xDF][\x80-\xBF]|[\xE0-\xEF][\x80-\xBF]{2}|
[\xF0-\xF7][\x80-\xBF]{3}
ref. 404 Blog Not Found:UTF-8 vs. ISO-10646
  <http://blog.livedoor.jp/dankogai/archives/50410033.html>