文字コード

utf8フラグがよくわかっていない件の回答

http://d.hatena.ne.jp/tori243/20100510/1273497722 不完全だけどこれの回答。 decodeした時に結果がころころ変わる件の原因 自分のコメント内容を再検証してみると… 1.フラグOFFした後。 文字コード→utf8とあるけど、そもそもこれが間違い! 「latin-1」で…

utf8フラグがよくわかっていない件

自分が文字コードについてわかっていないっぽい。 とあるサイト*1でスクレイピング*2した結果をほげほげしようとしたら、 以下のような感じになった。 スクリプト # テストの一部 { use Data::Dumper; # 最初のスクレイピング文字列 diag "str :",Dumper($rs…

文字コードを自動判別するモジュール Unicode::Japanese

Unicode::Japanese 文字コードを自動判別するのに Encode::Guess+Jcodeで行っていたのですが、 このモジュール使うとよさげなロジックで判別してくれそう。 こんな感じかな。 use Unicode::Japanese; my $s = Unicode::Japanese->new(); my $code = $s->get…