使用Python转换全角字符串为半角

葫芦小金刚

2016-08-10

关注关注

使用Python转换全角字符串为半角

关于全角转换为半角的问题,其实源自在公司的运营人员在输入法切换的时候选择了全角,结果导致程序有时候没有办法进行解析。

为了避免这样的问题再次出现,于是就有了将全角转换为半角的问题了。

在这里,会对以下内容进行描述:

什么是全角
如何将全角字符转换为半角
使用python实现上述转换操作

我们知道在编码中,存储在计算机中仅仅是1个数字,而编码其实充当的是1种转换的过程,如果将1个字符转换为1个数字而问题。

全角和半角

一般情况下,普通的英文字符只占用1个字节的空间,而1个字节有8位,因此可以存储256个字符。而汉字、日语及朝鲜文字这样CJK的文字很明显不止256个,因此会使用2个字节来存储。

而在使用英文输入法时,我们将1个英文字符所占的位置称为半角。而由于1个汉字占用2个英文字符的位置,因为我们将其称为全角。

需要注意的是,只有在支持汉字等语言的计算及上才存在全角和半角的概念。另外,虽然通常情况下的英文字母、数字键及符号键都是半角的,但是为了排列整齐,英文和其他拉丁文的字符和标签也可以使用全角格式。

因此,我们知道全角需要占用2个字节,而半角则占用1个字节。

全角转换为半角

在ASCII编码中,我们知道可以打印的字符只有127-33=94个。在这里,我们需要去除del键及ASCII编码表中前32位。

由于半角和全角只是占用字节个数的不同,因此全角可打印的字符也是94个。因此这2者之间是存在规律的,比如我们假设半角a字符的在计算机中存储的数字为60,而全角的a字符在计算机中存储的数字为1200。而假设a的下1个字符为b,其存储的数字为61, 那么全角的b字符存储的数字应为1201。

因此,这种一一映射的关系就查看各种规范中是如何定义的了。不同的规范定义会有所不同。

由于在Unicode规定中,半角字符是从33开始,到126结束。而Unicode中全角的编码是从65281开始到65374结束。

细心的你们会发现,这里少了1个字符,那就是空格。在半角中,空格是32,而在全角中它是12288。

python的实现转换

现在,我们使用python来实现转换的操作,我们会检查给定的字符是否为全角,只有在全角的情况下才进行转换的操作。

def FullToHalf(s): 


    n = [] 


    s = s.decode('utf-8') 


    for char in s: 


        num = ord(char) 


        if num == 0x3000: 


            num = 32 


        elif 0xFF01 <= num <= 0xFF5E: 


            num -= 0xfee0 


        num = unichr(num) 


        n.append(num) 


    return ''.join(n)

在这里,我们对字符串进行遍历,然后判断其字符的大小,如果给定的字符是全角则将其进行减法操作。最后将其组装在一起返回就可以了。

然后我们进行如下的测试:

s = "张三，是１个帅哥。" 


result = FullToHalf(s) 


print result 


print '-' * 80 


print s

其结果如下所示:

张三,是1个帅哥。 


----------------------------------------------------------------------- 


张三，是１个帅哥。

python字符串操作半角符号字符 python

葫芦小金刚

0 关注 0 粉丝 0 动态

关注关注

什么叫做类比，为什么有些 Python 入门教程结构不合理

想必关注未闻 Code的同学或多或少都在网上看过各种各样的 Python 入门教程。这些教程在讲 Python 基础数据结构的时候，一般是按照下面这个模式来讲的：。这个结构虽然说是中规中矩由浅入深，但是它并没有让读者做到类比学习触类旁通。因为这些教程的教

PYTandFA 2020-09-15

python对字符串操作的一些常用函数

当chars不为空时，chars会被理解成一个个字符；该函数的作用是将字符串收尾的符合要求的字符去掉，注意只能取出首尾的；该函数返回修改后的字符串，原字符串对象并不会改变。该函数的作用是通过指定分隔符对字符串进行切片；该函数返回的是一个列表，即分割后的子字

银角大王 2020-07-05

零基础学Python：一文看懂数字和字符串

Python3的数字类型分为整型、浮点型、布尔型、分数类型、复数类型。使用Python编写程序时，不需要声明变量的类型。由Python内置的基本数据类型来管理变量，在程序的后台实现数值与类型的关联，以及类型转换等操作。Python与其他高级语言定义变量的方

文山羊 2020-10-20

在 Golang 中如何快速判断字符串是否在一个数组中

在使用 Python 的时候，如果要判断一个字符串是否在另一个包含字符串的列表中，可以使用in 关键词，例如：。如果是有序的整型数组，那么我们可以使用二分查找，把时间复杂度O降到对数时间复杂度。其中，sort.Strings是一个 in-place 的修改

Tristahong 2020-10-14

字符串:系统内置方法

>>> str1 = str[:1] +‘（加）‘ + str[1:2] + ‘（班）‘ + str[2:]. 　　count 返回子串sub在字符串中出现的次数，start和end指定范围

fengzhiwu 2020-08-01

字符串常用操作

不论那个内容是中文、英文、数字甚至火星文。只要是被括起来的，就表示是字符串类型。使用 +将需要拼接的变量连在一起就行了。"D:\Program Files \python\python.exe" E:/python/python爬虫/从

kkpiece 2020-07-08

第二天学python

while else else是跟在while后的，while没有被break打断走else，被break打断，不走else。utf-8 3个字节表示一个中文。gbk 包含中文与英文字母，一个中文用两个字节。capitalize( ) 使字符串首字母大

shonmark 2020-06-27

2020 python学习第六天————字符串操作和列表操作

　　记录描述性质的状态。　　在单引号、双引号、三引号内包含的一串字符。　　str可以把任意类型转换成字符串类型。　　1.4.1 按索引取值。　　　　取出的由单一字符组成的str. 　　　　　　变量名 [ 索引 ]. 　　　　　　起始位置默认值为0. 　　　

meltsnow 2020-06-08

Python_运算符优先级与字符串操作

表达式可能会包含不止一个运算符，这些不同的运算先后次序就是运算符的优先级。对于数学运算符来说，Python就遵循着数学上的规则。所以2**(3-1)就等于4了，(1+1)**(5-2)就是2的立方，等于8。使用括号也有助于让表达式读起来更好理解，比如 /

shengge0 2020-06-01

二，Python的基本数据类型

1，Python中自定义一些数据类型，用来表示不同的信息，以便于计算机更好的储存和计算。　　　　创建方式：n = 123 n = int 其中n代表变量名，此行代码的意思是将“=”右边的值赋予左边的变量。　　Python中用来表示有序可变的元素集合，元素

fanhuasijin 2020-05-30

06-01字符串格式化.md

str.join连接，将可迭代对象转换为字符串注意：此操作会返回一个新的字符串对象，但不会操作原有可迭代对象。In [74]: ‘ ‘.join # join是字符串的方法,参数是可迭代对象,接收者是分隔符。printf style格式化对从其他语言,

hanxia 2020-05-28

python_30期_第2讲【字符串&运算符】

示例一：　　a=2　　b=3　　print（a+b）　　sum= a + b　　print. 示例三：　　a=2　　b=3　　print　　sum= a ** b#为2的3次方：输出结果为8　　print. 　　==，等于　　！=　　> 大于　　&

kkpiece 2020-05-28

[Python] 字符串操作

以下字符串可以变量.函数() 也可以 "字符串".函数(). 首字母大写，其余转换为小写。count，统计字符串出现的次数，跟列表的用法一样。center 让内容显示在中间，使内容两侧填充字符串，默认是空格。endswith，判断字

星辰大海的路上 2020-05-01

json反序列化的时候字符串为单引号的一个坑

最后终于找到了原因，这里记录一下。我们都知道，python内置函数 repr 可以打印出数据原生的面貌，我们来看一下前端同事传过来的json数据长什么样：。网上查了一下资料：json在进行反序列化的时候是不支持单引号的！因此我们需要将前端传过来的单引号的数

xiaoxiaoniaoer 2020-04-26

格式化字符串的4种方式

%号格式化字符串的方式从Python诞生之初就已经存在，时至今日，python官方也并未弃用%号，但也并不推荐这种格式化方式。print # egon asked lili to do something. 该format方法是在Python 2.6中引

sschencn 2020-04-11

python字符串操作

The string whose method is called is inserted in between each given string.Example: ‘.‘.join -> ‘ab.pq.rs‘。print #立即返回一个三元

waiwaiLILI 2020-03-20

python-字符串

print #超出索引范围，报错，IndexError. print #前面省略不写，代表从0开始，结果为"lea". print #前后都省却不写，代表从头取到尾，相当于复制结果为"learner". 字符串格式化

dxbjfu0 2020-03-06

你必须掌握的20个Python代码，短小精悍，用处无穷

当今python编程语言的潮流已经成为不可阻挡的趋势，python以其较高的可读性和简洁性备受程序员的喜爱。而python编程中的一些小的技巧，运用的恰当，会让你的程序事半功倍。以下的20个小的程序段，看似非常的简单，但是却非常的有技巧性，并且对个人的编程

逍遥友 2020-03-03

你必须掌握的20个Python代码，短小精悍，用处无穷

Morelia 2020-03-03

Python字符串操作

由零个或多个字符组成的有限序列。在Python程序中，如果我们把单个或多个字符用单引号或者双引号包围起来，就可以表示一个字符串。在\后面还可以跟一个八进制或者十六进制数来表示字符，例如\141和\x61都代表小写字母a，前者是八进制的表示法，后者是十六进制

yawei 2020-03-01

安科网

使用Python转换全角字符串为半角

葫芦小金刚

葫芦小金刚

相关推荐

什么叫做类比，为什么有些 Python 入门教程结构不合理

python对字符串操作的一些常用函数

零基础学Python：一文看懂数字和字符串

在 Golang 中如何快速判断字符串是否在一个数组中

字符串:系统内置方法

字符串常用操作

第二天学python

2020 python学习第六天————字符串操作和列表操作

Python_运算符优先级与字符串操作

二，Python的基本数据类型

06-01字符串格式化.md

python_30期_第2讲【字符串&运算符】

[Python] 字符串操作

json反序列化的时候字符串为单引号的一个坑

格式化字符串的4种方式

python字符串操作

python-字符串

你必须掌握的20个Python代码，短小精悍，用处无穷

你必须掌握的20个Python代码，短小精悍，用处无穷

Python字符串操作

葫芦小金刚