UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd7 in position 0: invalid continuation byte
原创
©著作权归作者所有:来自51CTO博客作者阿呆小记的原创作品,请联系作者获取转载授权,否则将追究法律责任
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd7 in position 0: invalid continuation byte
代码
# 1、读取数据并存为一个名叫 job_info 的数据框。
job_info = pd.read_csv(r'G:\Projects\pycharmeProject\大数据比赛\泰迪智能科技\data\job_info.csv')
print(job_info.head())
报错:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 0: invalid continuation byte
分析:
- 报错信息翻译为:
UnicodeDecodeError:“utf-8”编解码器无法解码位置0中的字节0xd7:连续字节无效
- 原因:在读取csv文件的时候,源文件的字符编码集可能是二进制形式,而当前编译工具在读取数据时无法进行转换的二进制数据 ,编码字符集形式不匹配造成。
解决方案:
# 1、读取数据并存为一个名叫 job_info 的数据框。
job_info = pd.read_csv(r'G:\Projects\pycharmeProject\大数据比赛\泰迪智能科技\data\job_info.csv',encoding='gbk')
print(job_info.head())
在读取csv文件的时候,指定字符编码集,设定encoding参数
即可。