编码及字符集探讨
原创
©著作权归作者所有:来自51CTO博客作者xcf007的原创作品,请联系作者获取转载授权,否则将追究法律责任
我们用到的工具UltraEdit
1.文件编码
新建一个文本文件,我们知道我们输入一篇文章,可能需要保存到存储设备中,既然存储,那么我们怎么存呢,我们知道计算机只认识0和1,对于语言文字中的各种符号标记我们怎么存储到计算机中,这就有个编码的问题了。
我们知道如果识别一个学生,我们可以通过给学生编号的方式来管理,这就是学号,而对于各种字符我们类似,进行编码的方式来识别,
了解ASCII码的知道,它用0-255定义这么256个英文及标点等符号。只需要一个字节也就是8个比特位就够了。
对于像我们中文这样的亚洲文字怎么办呢,于是出现了各种编码,比如GB2312,GBK等等。
他们使用2个字节存储汉字。
另存我们的文件,存储格式我们用ANSI方式,
这样英文占1个字节,而汉字占2个字节。
我们输入几个字符:
ABCDE中文
这样是5个英文字母和2个汉字共占9个字节,你可以查看下文件属性验证下。
我们在ultraEdit里面Ctrl+H用16进制方式查看下
我们看到41是A的ASCII码,依次42,43,44,45是BCDE
而 D6 D0是 中
CEC4是 文
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
Java设置JSON字符串参数编码
本文详细介绍了如何在Java中创建JSON字符串以及在Java中设置JSON字符串参数编码的方法。
json 字符串 JSON Java -
python基础-条件语句、while、字符串格式化、运算符、字符串编码
学习Python基础的笔记,看视频学Python。
字符串 Python 代码块 python基础 -
字符集 编码
字符是人类创造出来的,代表了一定的含义的符号,这些符号在计算机中如何存储?计
字符集 编码 utf-8 unicode ASCII -
字符集和编码
一、什么是字符集?什么是编码? 字符(Character)是文字与符号的总称,包括文字、图形符号、数学符号等。 一组抽象字符的集合就是字符集(是字符
uft-8 字符编码 ico 字符串 编码方式 -
编码字符集
在计算机中,只有二进制的数据,不管数据是在内存中,还是在外部存储设备上。对于我
java字节码 mysql ico 二进制数 数据