北海道苫小牧市出身の初老PGが書くブログ

永遠のプログラマを夢見る、苫小牧市出身のおじさんのちらしの裏

perl5.8のUnicodeは便利

前回とまったく逆のタイトルで恐縮だけども(笑)、utf8フラグを立てて文字列を扱うと日本語を直接正規表現にかけれてとても便利。

use utf8;として、utf8でソースを書いてやるのが一番使いやすいかな。内部では全ての文字列をutfフラグを立てて扱う。変換にはEncode::decodeとか、Encode::Guessも有効。utfフラグさえ立てれば、日本語の正規表現がばっちり使える。

処理が終わったら、最後はbinmodeを使うかopenの時にPerlIOな文字コード指定をして入出力、と。