【情感分析必备】python文件读写:codecs
codecs在读取文件时,发生错误:
UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbe in position 0: invalid start byte
中文切换编码:gbk,正常解决。
但有时,utf-8和gbk都不好使用,使用notepad++,打开有乱码;看到有小块黑色。
这时候,需要加个参数, errors="ignore"
# 读文件:含特殊字符 import codecs f = codecs.open(‘20.txt‘, ‘rb‘,encoding=‘gbk‘, errors="ignore") # 默认编码utf-8,中文是gbk content = f.readline() f.close() print(‘in:‘,content)
参考网站:https://www.cnblogs.com/always-fight/p/10304806.html
相关推荐
YENCSDN 2020-11-17
lsjweiyi 2020-11-17
houmenghu 2020-11-17
Erick 2020-11-17
HeyShHeyou 2020-11-17
以梦为马不负韶华 2020-10-20
lhtzbj 2020-11-17
夜斗不是神 2020-11-17
pythonjw 2020-11-17
dingwun 2020-11-16
lhxxhl 2020-11-16
坚持是一种品质 2020-11-16
染血白衣 2020-11-16
huavhuahua 2020-11-20
meylovezn 2020-11-20
逍遥友 2020-11-20
weiiron 2020-11-16