在众多的utf-8码点值中,除了ascii,你还应该记住「EF BF BD」,因为它是很多编程语言以及库中的备胎,即无效的码点值在编码的时候会默认用这个码点值进行替换,即utf-8中的超级「备胎」(REPLACEMENT CHARACTER)。
UTF-8字符「EF BF BD」-备胎
转载本文章为转载内容,我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题,欢迎原作者联系我们进行内容更正或删除文章。
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
python基础-条件语句、while、字符串格式化、运算符、字符串编码
学习Python基础的笔记,看视频学Python。
字符串 Python 代码块 python基础 -
UTF-8字符串分段选取(转)
C或C++语言处理宽字节字符串上是个弱项,虽然stl定义了wstring等类型,但是实际应整个
字符串 #include 字符串长度 -
gbk与utf-8字符串无乱码截取
gbk与utf-8字符串无乱码截取
字符串 gbk utf-8 截取