解决Python print 输出文本显示 gbk 编码错误问题
前阵子想爬点东西,结果一直提示错误UnicodeEncodeError: ‘gbk' codec can't encode character ‘\xa0' in position,在网上一查,发现是 Windows 的控制台的问题。控制台的编码是 GBK,Python 是 UTF-8,造成了冲突。下面给出三种解决方法。
第一种方法:直接替换出错的内容
import requests url = 'https://blog.csdn.net/jianhong1990/article/details/17349537' print(requests.get(url).text.replace('\xa0', ' '))
第二种方法:再解码
先用 GBK 编码,加个 ignore 丢弃错误的字符,然后再解码。
import requests url = 'https://blog.csdn.net/jianhong1990/article/details/17349537' print(requests.get(url).text.encode('gbk', 'ignore').decode('gbk')
第三种方法:修改控制台编码
新建一个 cmd.reg, 输入代码:
Windows Registry Editor Version 5.00 [HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe] "CodePage"=dword:0000fde9 "FontFamily"=dword:00000036 "FontWeight"=dword:00000190 "FaceName"="Consolas" "ScreenBufferSize"=dword:232900d2 "WindowSize"=dword:002b00d2
保存后运行。如果 Ctrl+B 无效,用 python.exe 打开.py程序后再试一次。
总结
相关推荐
learningever 2020-09-19
81214051 2020-06-01
ITxiaobaibai 2020-03-23
84590091 2020-02-16
Jiajinjin 2009-11-04
zhangxiaocc 2019-10-24
心中要有一片海 2012-10-22
eastnow 2012-10-11
87437616 2011-05-09
secondid 2010-07-26
qiaosym 2010-07-07
shutFuckingup 2010-06-12
81214051 2020-04-25
84590091 2020-04-22
SDUTACM 2020-02-15
xuanlvhaoshao 2020-01-23