GBK与UTF-8的区别
GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。
至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。
GBK包含全部中文字符;
UTF-8则包含全世界所有国家需要用到的字符
转载
精选
2010-11-16 23:27:21
574阅读
今天突然想到这个问题,然后网上搜了搜:
GBK的子集GB2312
GB2312是GBK的子集,GBK是GB18030的子集。GB2312编码大约包含6000多汉字(不包括特殊字符),编码范围为第一位 b0-f7,第二位编码范围为a1-fe(第一位为cf时,第二位为a1-d3),计算一下汉字个数为6762个汉字。当然还有其他的字符。包括控制键和 其他字符大约7573个字符编码。
转载
2010-08-27 10:43:47
524阅读
utf-8 和gbk的区别
原创
2014-02-26 23:01:21
272阅读
GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)。GBK编码专门用来解决中文编码的,是双字节的。不论中英文都是双字节的。UTF-8编码是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。另外,如果是外国人访问你的GBK网页,需要下载中文语言包支持。访问UT
原创
2022-03-03 18:09:28
662阅读
GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)。GBK编码专门用来解决中文编码的,是双字节的。不论中英文都是双字节的。UTF-8编码是用以解决国际上字符的一种多字节
原创
2017-11-17 13:37:55
140阅读
GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)。GBK编码专门用来解决中文编码的,是双字节的。不论中英文都是双字节的。UTF-8编码是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)...
转载
2017-11-17 13:38:00
68阅读
2评论
GBK就是在保存你的帖子的时候,一个汉字占用两个字节。。外国人看会出现乱码,此为我中华为自己汉字编码而形成之解决方案。 UTF8就是在保存你的帖子的时候,一个汉字占用3个字节。。但是外国人看的话不会乱码,此为西人为了解决多字节字符而形成之解决方案。 ASCII(ISO-8859-1)是鼻祖,最简单的 ...
转载
2021-09-07 17:03:00
227阅读
2评论
字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。
至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。
GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。
GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)
转载
精选
2014-08-03 14:15:23
1232阅读
GBK版本与UTF-8版本功能是一样的.只不过编码方式不同。
GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。
至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的网站则用UTF-8节省空间。
GBK包含全部中文字符;UTF-8则包含全世界所
转载
精选
2008-12-18 10:41:17
813阅读
UTF-8: Unicode Transformation Format:
其本质上是一种多字节编码,英文1个字节(8位),中文3个字节(24位)
所以,在UTF-8编码的页面,就算在老外的英文浏览器上也可以正确显示
GBK:国家编码,特别适合于网站客户群体是只面向中国国内的用户。
它是一种双字节编码,不论中文,英文都采用的双字节(16位),而中/英区别在于中文
原创
2012-04-21 16:55:43
685阅读
java不同编码之间进行转换,都需要使用unicode作为中转 String t = "这是一个字符串aaa111"; String utf8 = new String(t.getBytes( "UTF-8")); String unicode = new String(utf8.getBytes( ...
转载
2021-09-09 15:12:00
195阅读
2评论
BOM——Byte Order Mark,就是字节序标记 在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的
原创
2022-08-07 01:04:22
199阅读
BOM——Byte Order Mark,就是字节序标记 在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前,先传输 字符"ZERO WIDTH NO-BREAK SPACE"。这样如果接收者收到FEFF,就表明这个字节流是Big-Endian的
转载
2014-01-11 00:00:00
308阅读
2评论
QTextCodec *gbk = QTextCodec::codecForName("gb18030"); QTextCodec *utf8 = QTextCodec::codecForName("utf-8"); QTextCodec::setCodecForTr(gbk); QTextCodec::setCodecForLocale(gbk);// QString utfStr = QObject::trUtf8( tr("webservice 读取完成").toUtf8()); //utf-8 QString utfStr =
转载
2013-09-30 22:19:00
233阅读
2评论
粉丝求助:如何解决:把编辑器和浏览器的字符集统一设置成utf-8或者gbk即可。
转载
2021-06-18 13:17:18
334阅读
UNICODE,GBK,UTF-8区别 简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与gbk就是不一样的,假设uncode为a040,gbk为b030,而uft-8码,就是把那个值表现的形式.utf-8码完全只针对uncode来组织的,如果G
转载
2010-12-16 14:22:00
69阅读
UNICODE,GBK,UTF-8区别简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与gbk就是不一样的,假设uncode
转载
2010-12-16 14:22:00
81阅读
2评论
UNICODE,GBK,UTF-8区别 简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与
转载
2007-05-31 20:58:00
46阅读
区别 简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与gbk就是不一样的
转载
2023-05-24 12:49:13
140阅读
GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)。GBK编码专门用来解决中文编码的,是双字节的。不论中英文都是双字节的。 UTF-8 编码是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论
转载
2019-09-24 22:05:00
108阅读
2评论