读取二进制文件编码是一个比较麻烦的事情
我们在decode二进制文件时,是需要知道编码格式的,除了常见的utf-8,还有UCS-2-Little Endian(utf-16-le
)和UTF-8-BOM(utf-8-sig
)
如下是UCS-2-Little Endian的二进制文件前缀
如下是UTF-8-BOM的二进制文件前缀
做个判断,确定decode解码格式
读取二进制文件编码是一个比较麻烦的事情
我们在decode二进制文件时,是需要知道编码格式的,除了常见的utf-8,还有UCS-2-Little Endian(utf-16-le
)和UTF-8-BOM(utf-8-sig
)
如下是UCS-2-Little Endian的二进制文件前缀
如下是UTF-8-BOM的二进制文件前缀
做个判断,确定decode解码格式
上一篇:Linux: 基础
二进制安装docker
首先我们知道,字节流是不易读的,而且哪怕直接读取出来了所采用的显示格式也不一定是你所期待的那种ASCII码,常用编辑器往往需要安装插件才能较为可视地打开二进制文件,比如 VScode 里的 hexdump 插件。于是当需要处理字节层面的数据,且数据文件不太大时,我习惯把那些二进制文件转换成十六进制字符串文件来直接打开,其中手动添加一些空格啊什么的将不同数据段分隔开,我觉得还是挺方便的
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M