解决UnicodeDecodeError: ‘utf-8‘ codec can‘t decode : invalid continuation byte

原创

wx63899b601ff16 2022-12-03 00:00:10 ©著作权

文章标签 python encoding ico 文章分类 OpenStack 云计算

©著作权归作者所有：来自51CTO博客作者wx63899b601ff16的原创作品，请联系作者获取转载授权，否则将追究法律责任

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xed in position 4249: invalid continuation byte 比较烦人的问题，用notepad打开显示’utf-8’，但是还是不行

df = pd.read_csv(r'...\11-23.txt',header=None, sep='\t',encoding='utf8')

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xed in position 142121: invalid continuation byte

error_bad_lines貌似没有生效

df = pd.read_csv(r'...\11-23.txt',header=None, sep='\t', error_bad_lines=False)


FutureWarning: The error_bad_lines argument has been deprecated and will be removed in a future version.

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xed in position 142121: invalid continuation byte

看了下源码，使用encoding_errors解决问题

df = pd.read_csv(r'...\time_space_tag\11-23.txt',header=None, sep='\t', encoding_errors='ignore')

Codec registry and base classes

下一篇：torch.gather/torch.scatter

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯