• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

perl输出中文有乱码

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

测试文件的时候发现输出中文有乱码,所以学习了一下perl的Encode原理。现做一下总结:
perl的基础知识:在Perl看来, 字符串只有两种形式。一种是octets, 即8位序列, 也就是我们通常说的字节数组。另一种utf8编码的字符串, perl管它叫string。 也就是说: Perl只认识两种编码: Ascii(octets)和utf8(string)。

所以输出时候出现乱码,应该把utf8编码转为用户能够接受的形式。例如中文用gb2312.

my $s=":<中文关键词>=英国皇家学会;;《哲学汇刊》;;物理科学;;科学传播.";

$a=$s=~/>=(.+)$/;

print encode('gb2312',$1)."\n"; #输出英国皇家学会;;《哲学汇刊》;;物理科学;;科学传播.


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
perl对源文件内容修改方法整理发布时间:2022-07-22
下一篇:
Perl学习笔记(2)----正则表达式数字匹配的一个疏忽发布时间:2022-07-22
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap