Python中字符串与编码示例代码

drtheodore

2019-05-20

在最新的Python 3版本中，字符串是以Unicode编码的，即Python的字符串支持多语言

编码和解码

　　字符串在内存中以Unicode表示，在操作字符串时，经常需要str和bytes互相转换
　　如果在网络上传输或保存到磁盘上，则从内存读到的数据就是str，要把str变为以字节为单位的bytes，称为编码
　　如果从网络或磁盘上读取字节流，则从网络或磁盘上读到的数据就是bytes，要把bytes变为str，称为解码
　　为避免乱码问题，应当始终坚持使用UTF-8编码对str和bytes进行转换

使用示例：

单个字符的编码

print(ord('A')) #输出：65，获取字符的整数表示
print(chr(66)) #输出：B，把编码转换为对应的字符

十六进制表示

print('中文') #输出：'中文'，
print('\u4e2d\u6587') #输出：'中文'，'\u4e2d\u6587'和'中文'完全对等，如果知道字符的整数编码，还可以用十六进制这么写str

bytes类型的数据表示

x = b'ABC' #Python对bytes类型的数据用带b前缀的单引号或双引号表示，'ABC'和b'ABC'在显示上完全一样，但bytes的每个字符都只占用一个字节

编码

print('ABC'.encode('ascii')) #输出：b'ABC'，以Unicode表示的str通过encode()方法可以编码为指定的bytes
print( '中文'.encode('utf-8')) #输出：b'\xe4\xb8\xad\xe6\x96\x87'，
print( '中文'.encode('ascii')) #输出：报错，因为中文字符在ascii编码范围外，所以导致编码失败

解码

print(b'ABC'.decode('ascii')) #输出：'ABC'
print(b'\xe4\xb8\xad\xe6\x96\x87'.decode('ascii')) #输出：'中文'
print(b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')) #输出：'中'，如果bytes中只有一小部分无效的字节，可以传入errors='ignore'忽略错误的字节

计算长度

#len(a)函数返回a的长度，如果a是字符串则返回字符数，如果a是字节表示则返回字节数
print(len('中文')) #输出：2，共2个字符
print(len('ABC')) #输出：3，共3个字符
print(len(b'ABC')) #输出：3，共是3个字节
print(len(b'\xe4\xb8\xad\xe6\x96\x87')) #输出：6，共是6个字节
print(len('中文'.encode('utf-8'))) #输出：6, 1个中文字符经过UTF-8编码后通常会占用3个字节,因此两个汉字的字节数是6

源码文件开头与编码

#!/usr/bin/env python3    告诉Linux/OS X系统，这是一个Python可执行程序，Windows系统会忽略这个注释
# -*- coding: utf-8 -*-   告诉Python解释器，按照UTF-8编码读取源代码，否则在源代码中写的中文输出可能会有乱码

#注意：告诉编译器使用UTF-8编码并不意味着.py文件就是UTF-8编码的，必须并且要确保.py文件用UTF-8 without BOM编码保存，才可确保文件中的中文正常显示

总结

以上所述是小编给大家介绍的Python中字符串与编码示例代码，希望对大家有所帮助，如果大家有任何疑问欢迎给我留言，小编会及时回复大家的！

python字符串操作字符编码字符串函数 python函数编码转换 bytes python

drtheodore

0 关注 0 粉丝 0 动态

关注关注

python基础字符编码转换

#python2上所有的字符编码都需要先decode到unicode,再从unicode encode到目标编码。#二进制转换为字符串，使用decode，此处二进制的编码格式如果填写错误可能会导致二进制无法转换为字符串，导致程序报错。#python3上默认

JakobHu 2019-11-09

零基础学Python：一文看懂数字和字符串

Python3的数字类型分为整型、浮点型、布尔型、分数类型、复数类型。使用Python编写程序时，不需要声明变量的类型。由Python内置的基本数据类型来管理变量，在程序的后台实现数值与类型的关联，以及类型转换等操作。Python与其他高级语言定义变量的方

文山羊 2020-10-20

在 Golang 中如何快速判断字符串是否在一个数组中

在使用 Python 的时候，如果要判断一个字符串是否在另一个包含字符串的列表中，可以使用in 关键词，例如：。如果是有序的整型数组，那么我们可以使用二分查找，把时间复杂度O降到对数时间复杂度。其中，sort.Strings是一个 in-place 的修改

Tristahong 2020-10-14

字符串:系统内置方法

>>> str1 = str[:1] +‘（加）‘ + str[1:2] + ‘（班）‘ + str[2:]. 　　count 返回子串sub在字符串中出现的次数，start和end指定范围

fengzhiwu 2020-08-01

字符串常用操作

不论那个内容是中文、英文、数字甚至火星文。只要是被括起来的，就表示是字符串类型。使用 +将需要拼接的变量连在一起就行了。"D:\Program Files \python\python.exe" E:/python/python爬虫/从

kkpiece 2020-07-08

python对字符串操作的一些常用函数

当chars不为空时，chars会被理解成一个个字符；该函数的作用是将字符串收尾的符合要求的字符去掉，注意只能取出首尾的；该函数返回修改后的字符串，原字符串对象并不会改变。该函数的作用是通过指定分隔符对字符串进行切片；该函数返回的是一个列表，即分割后的子字

银角大王 2020-07-05

第二天学python

while else else是跟在while后的，while没有被break打断走else，被break打断，不走else。utf-8 3个字节表示一个中文。gbk 包含中文与英文字母，一个中文用两个字节。capitalize( ) 使字符串首字母大

shonmark 2020-06-27

二，Python的基本数据类型

1，Python中自定义一些数据类型，用来表示不同的信息，以便于计算机更好的储存和计算。　　　　创建方式：n = 123 n = int 其中n代表变量名，此行代码的意思是将“=”右边的值赋予左边的变量。　　Python中用来表示有序可变的元素集合，元素

fanhuasijin 2020-05-30

python_30期_第2讲【字符串&运算符】

示例一：　　a=2　　b=3　　print（a+b）　　sum= a + b　　print. 示例三：　　a=2　　b=3　　print　　sum= a ** b#为2的3次方：输出结果为8　　print. 　　==，等于　　！=　　> 大于　　&

kkpiece 2020-05-28

[Python] 字符串操作

以下字符串可以变量.函数() 也可以 "字符串".函数(). 首字母大写，其余转换为小写。count，统计字符串出现的次数，跟列表的用法一样。center 让内容显示在中间，使内容两侧填充字符串，默认是空格。endswith，判断字

星辰大海的路上 2020-05-01

json反序列化的时候字符串为单引号的一个坑

最后终于找到了原因，这里记录一下。我们都知道，python内置函数 repr 可以打印出数据原生的面貌，我们来看一下前端同事传过来的json数据长什么样：。网上查了一下资料：json在进行反序列化的时候是不支持单引号的！因此我们需要将前端传过来的单引号的数

xiaoxiaoniaoer 2020-04-26

什么叫做类比，为什么有些 Python 入门教程结构不合理

想必关注未闻 Code的同学或多或少都在网上看过各种各样的 Python 入门教程。这些教程在讲 Python 基础数据结构的时候，一般是按照下面这个模式来讲的：。这个结构虽然说是中规中矩由浅入深，但是它并没有让读者做到类比学习触类旁通。因为这些教程的教

PYTandFA 2020-09-15

2020 python学习第六天————字符串操作和列表操作

　　记录描述性质的状态。　　在单引号、双引号、三引号内包含的一串字符。　　str可以把任意类型转换成字符串类型。　　1.4.1 按索引取值。　　　　取出的由单一字符组成的str. 　　　　　　变量名 [ 索引 ]. 　　　　　　起始位置默认值为0. 　　　

meltsnow 2020-06-08

Python_运算符优先级与字符串操作

表达式可能会包含不止一个运算符，这些不同的运算先后次序就是运算符的优先级。对于数学运算符来说，Python就遵循着数学上的规则。所以2**(3-1)就等于4了，(1+1)**(5-2)就是2的立方，等于8。使用括号也有助于让表达式读起来更好理解，比如 /

shengge0 2020-06-01

06-01字符串格式化.md

str.join连接，将可迭代对象转换为字符串注意：此操作会返回一个新的字符串对象，但不会操作原有可迭代对象。In [74]: ‘ ‘.join # join是字符串的方法,参数是可迭代对象,接收者是分隔符。printf style格式化对从其他语言,

hanxia 2020-05-28

格式化字符串的4种方式

%号格式化字符串的方式从Python诞生之初就已经存在，时至今日，python官方也并未弃用%号，但也并不推荐这种格式化方式。print # egon asked lili to do something. 该format方法是在Python 2.6中引

sschencn 2020-04-11

python字符串操作

The string whose method is called is inserted in between each given string.Example: ‘.‘.join -> ‘ab.pq.rs‘。print #立即返回一个三元

waiwaiLILI 2020-03-20

python-字符串

print #超出索引范围，报错，IndexError. print #前面省略不写，代表从0开始，结果为"lea". print #前后都省却不写，代表从头取到尾，相当于复制结果为"learner". 字符串格式化

dxbjfu0 2020-03-06

你必须掌握的20个Python代码，短小精悍，用处无穷

当今python编程语言的潮流已经成为不可阻挡的趋势，python以其较高的可读性和简洁性备受程序员的喜爱。而python编程中的一些小的技巧，运用的恰当，会让你的程序事半功倍。以下的20个小的程序段，看似非常的简单，但是却非常的有技巧性，并且对个人的编程

逍遥友 2020-03-03

你必须掌握的20个Python代码，短小精悍，用处无穷

Morelia 2020-03-03

安科网

Python中字符串与编码示例代码

drtheodore

drtheodore

相关推荐

python基础字符编码转换

零基础学Python：一文看懂数字和字符串

在 Golang 中如何快速判断字符串是否在一个数组中

字符串:系统内置方法

字符串常用操作

python对字符串操作的一些常用函数

第二天学python

二，Python的基本数据类型

python_30期_第2讲【字符串&运算符】

[Python] 字符串操作

json反序列化的时候字符串为单引号的一个坑

什么叫做类比，为什么有些 Python 入门教程结构不合理

2020 python学习第六天————字符串操作和列表操作

Python_运算符优先级与字符串操作

06-01字符串格式化.md

格式化字符串的4种方式

python字符串操作

python-字符串

你必须掌握的20个Python代码，短小精悍，用处无穷

你必须掌握的20个Python代码，短小精悍，用处无穷

drtheodore