Perl encode函数用法

jackm

2010-07-23

本文和大家重点讨论一下Perl encode函数用法，Perl从5.6开始已经开始在内部使用utf8编码来表示字符，我们只需要利用好Encode这个模块便能充分发挥Perl的utf8字符的优势了。

Perl encode函数用法

最近在处理中文时遇到乱码的问题，google了一下，发现下面这篇文章。茅塞顿开！

Perl从5.6开始已经开始在内部使用utf8编码来表示字符，也就是说对中文以及其他语言字符的处理应该是完全没有问题的。我们只需要利用好Encode这个模块便能充分发挥Perl的utf8字符的优势了。
下面就以中文文本的处理为例进行说明，比如有一个字符串"测试文本"，我们想要把这个中文字符串拆成单个字符，可以这样写：

useEncode;  



$dat=&#34;测试文本&#34;;  




$str=decode(&#34;gb2312&#34;,$dat);  




@chars=split//,$str;  



foreach$char(@chars){  


printencode(&#34;gb2312&#34;,$char),&#34;\n&#34;;  


}

结果大家试一试就知道了，应该是令人满意的。
这里主要用到了Encode模块的decode、encode函数。要了解这两个函数的作用我们需要清楚几个概念：
1、Perl字符串是使用utf8编码的，它由Unicode字符组成而不是单个字节，每个utf8编码的Unicode字符占1~4个字节（变长）。
2、进入或离开Perl处理环境（比如输出到屏幕、读入和保存文件等等）时不是直接使用Perl字符串，而需要把Perl字符串转换成字节流，转换过程中使用何种编码方式完全取决于你（或者由Perl代劳）。一旦Perl字符串向字节流的编码完成，字符的概念就不存在了，变成了纯粹的字节组合，如何解释这些组合则是你自己的工作。
我们可以看出如果想要Perl按照我们的字符概念来对待文本，文本数据就需要一直用Perl字符串的形式存放。但是我们平时写出的每个字符一般都被作为纯ASCII字符保存（包括在程序中明文写出的字符串），也就是字节流的形式，这里就需要encode和decode函数的帮助了。

◆encode函数顾名思义是用来编码Perl字符串的。Perl encode函数用法中可以将Perl字符串中的字符用指定的编码格式编码，最终转化为字节流的形式，因此和Perl处理环境之外的事物打交道经常需要它。其格式很简单：
$octets=encode(ENCODING,$string[,CHECK])
$string：Perl字符串
encoding：　是给定的编码方式
$octets:是编码之后的字节流
check:　表示转换时如何处理畸变字符（也就是Perl认不出来的字符）。一般不需使用编码方式视语言环境的不同有很大变化，默认可以识别utf8、ascii、ascii-ctrl、iso-8859-1等。

◆decode函数则是用来解码字节流的。它按照你给出的编码格式解释给定的字节流，将其转化为使用utf8编码的Perl字符串，一般来说从终端或者文件取得的文本数据都应该用decode转换为Perl字符串的形式。它的格式为：

perl encode 字符编码字符串函数编码转换字符

安科网

Perl encode函数用法

jackm

jackm

相关推荐

YAML 速查文档

Centos7 安装mysql5.6 怕坑记录

CentOS安装 Perl

python相对企业语言优势在哪

perl 一行程序

linux非root用户安装perl及其基本用法

pip命令报错“no perl script found in input”

YAML

Circos软件学习

otrs离线部署(centos7详细采坑记)

一篇值得收藏的正则表达式文章

二、安装perl环境

Natas32 Writeup（Perl 远程代码执行）

Natas29 Writeup（Perl命令注入、00截断、绕过过滤）

Perl-求交集和并集（Nvidia2018笔试）

Perl 笔试题2 -- 统计单词频次

简单描述PHP发展历程

用php搭建博客系统-待续

perl 在windows上获取当前桌面壁纸

Nginx Rewrite

jackm