背景
默认情况下dos的编码和操作系统编码一致,比如我的是gbk
此时查看日志或者网页会有乱码,如
知识储备
代码页是字符集编码的别名,也有人称"内码表"。早期,代码页是IBM称呼电脑BIOS本身支持的字符集编码的名称。当时通用的操作系统都是命令行界面系统,这些操作系统直接使用BIOS供应的VGA功能来显示字符,操作系统的编码支持也就依靠BIOS的编码。现在这BIOS代码页被称为OEM代码页。图形操作系统解决了此问题,图形操作系统使用自己字符呈现引擎可以支持很多不同的字符集编码。
早期IBM和微软内部使用特别数字来标记这些编码,其实大多的这些编码已经有自己的名称了。虽然图形操作系统可以支持很多编码,很多微软程序还使用这些数字来点名某编码。
先查看window有哪些活动代码页,下面列出一部分,包含了gb2312和utf-8
解决方法
如何修改呢
使用chrome的f12抓取报文,看看百度网页的编码是什么样子的?
原来百度使用的字符编码为utf-8,那么我们尝试修改window的命令窗口为utf-8试试。
可以使用chcp命令来查看和修改
修改为utf-8编码
执行命令:CHCP 65001,弹出命令提示符窗口
此时查看百度的网页
ok 没有乱码了。