2007-11-04から1日間の記事一覧

漢字だけを抜き出す Ruby の正規表現

すべての漢字を取り出す正規表現がとても参考になった。結局次のような単純なコードでよいらしい。 (文字コードは UTF-8 を仮定) $KCODE = 'u' require 'jcode' puts 'aA0&!漢字です'.gsub(/[^一-龠]/, '') # => "漢字" ミソは、$KCODE = 'u' して require…