perl輸出中文有亂碼

來源:互聯網
上載者:User

標籤:encode   code   序列   學習   中文   字串   字元   哲學   perl   

測試檔案的時候發現輸出中文有亂碼,所以學習了一下perl的Encode原理。現做一下總結:
perl的基礎知識:在Perl看來, 字串只有兩種形式。一種是octets, 即8位序列, 也就是我們通常說的位元組數組。另一種utf8編碼的字串, perl管它叫string。 也就是說: Perl只認識兩種編碼: Ascii(octets)和utf8(string)。

所以輸出時候出現亂碼,應該把utf8編碼轉為使用者能夠接受的形式。例如中文用gb2312.

my $s=":<中文關鍵詞>=英國皇家學會;;《哲學彙刊》;;物理科學;;科學傳播.";

$a=$s=~/>=(.+)$/;

print encode(‘gb2312‘,$1)."\n"; #輸出英國皇家學會;;《哲學彙刊》;;物理科學;;科學傳播.

perl輸出中文有亂碼

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.