Hatena::Groupchinese

妄言砂漠

2009-03-03

[] 正規表現とUnicode  正規表現とUnicode - 妄言砂漠 を含むブックマーク はてなブックマーク -  正規表現とUnicode - 妄言砂漠

PHPのmb_eregでCJK統合漢字拡張A(U+3400~U+3FFF)およびCJK統合漢字拡張B(U+20000~U+20FFF)にマッチするような正規表現を書きたいのですが、書き方が分からない。とりあえず勘で書いた以下のコードは無効*1

if (mb_ereg("[\u3400-\u3FFF]+", $str) == 1) {
    echo "CJK Ext A";
}

さらなる疑問:mb_eregは\p{Han}が使えないのかしらん。

[] おっさんvsヤング  おっさんvsヤング - 妄言砂漠 を含むブックマーク はてなブックマーク -  おっさんvsヤング - 妄言砂漠

ぁゃιぃ(*゚ー゚)NEWS 2ndより。さっそくチェックしてみる。

△ アベック
○ ズボン
○ ジーパン
× 割ぽう着
○ コールテン
× えもん掛け
× レコード
△ スパゲッティ
○ とっくり
× セコハン
○ チャック
× ズック
× ラッパズボン
○ 喫茶店
△ チャンネル回す
○ チョッキ
○ デザート
△ パンティ
× ビフテキ

○が1点、△を0.5点として19点満点で10点。ふう。

*1:Tclだとこんな感じでOKなんですが。

トラックバック - http://chinese.g.hatena.ne.jp/Ctrans/20090303