char mysql varchar 实例 mysql char()

转载

mob6454cc623087 2023-07-10 15:32:45

文章标签 浮点数定点数删除操作 文章分类 MySQL 数据库

数据类型的选择

1.CHAR与VARCHAR

存储/检索的方式不同.

CHAR是固定长度,而VARCHAR是可变长度

非SQLMode下,超过指定长度,会做截取操作.SQLMode模式下,会报错

'adcdefgh'插入到CHAR(4)和VARCHAR(4)中,前者需要4字节,后者需要5字节,结果都是非SQLMode下存储了'abcd' todo 为什么VAR(4) 需要5字节??

CHAR会去掉尾部的空格,VARCHAR则不会.

CHAR处理速度快,但浪费存储空间,对长度变化不大,且对查询速度有较高要求的推荐使用CHAR

VARCHAR 随着MySQL的不断升级,性能也在不断提高,许多应用用使用VARCHAR.

不同引擎对CHAR和VARCHAR的使用原则不同:

MyISAM : 建议使用固定长度代替可变长度,因此推荐CHAR

MEMORY : 无论使用CHAR或VARCHAR都默认处理成固定长度的数据存储.

InnoDB : 建议使用VARCHAR .内部存储格式没有区分固定长度/可变长度.性能因素主要是数据行使用的存储总量.CHAR的平均空间大于VARCHAR ,用VARCHAR进行存储和磁盘I/O比较好.

2.TEXT与BLOB

少量字符串选择CHAR/VARCHAR,大文本选择TEXT/BLOB.

二者之间的区别是,BLOB可以用来保存二进制数据,比如照片;而TEXT只能保存字符数据,比如文章/日记.

TEXT/BLOB 会引发性能问题,特别是在执行了大量的删除操作时.

删除操作会在数据表中留下很大的"空洞",对日后插入操作的性能上有影响.

为了提高性能,建议定期使用OPTIMIZE TABLE 对这类表进行碎片整理.

查看表的物理文件大小:

du -sh tbl_name.* ;

经测试,即使进行了删除操作,表的物理大小并没有减少.

OPTIMIZE TABLE tbl_name ;

优化后发现物理文件减小了.

可以使用合成的(Syntheic)索引来提高TEXT/BLOB的查询性能.

合成索引就是根据大文本的内容建立一个散列值,并把该值存储到一个单独的数据列中.接下来就可以通过它进行查找数据.

注意,该方式只能对精确查找的方式进行优化,而类似于< , >= 这种范围查找没有用处.

散列值可以通过MD5(),SHA1(),CRC32()等方式生成,也可以使用自己的应用程序逻辑来计算散列值.

数值型的散列值可以很高效的存储.如果生成的散列值尾部有空格,就不要存储到CHAR/VARCHAR列中. todo 为什么VARCHAR 也不行,VARCHAR不是不对尾部空格进行处理么??

Demo:

CREATE TABLE t (id VARCHAR(100) , context BLOB , hash_value VARCHAR(40) ;

INSERT INTO t VALUES(1,REPEAT('beijing',2),MD5(context));

SELECT * FROM t where hash_value=MD5(repeat('beijing 2008',2));

如果要使用模糊查询,MySQL提供了前缀索引,也就是只为字段的前n列创建索引.

Demo:

CREATE INDEX idx_blob ON t (context(100)); --为context的前100个字符创建索引.

DESC SELECT * FROM t WHERE context LIKE 'beijing%' ; --'%'不能放在最前面,否则索引不起作用.

注意:

避免在不必要的时候检索大型的BLOB/TEXT.除非WHERE字句可以精确匹配到哪一行.

推荐使用索引进行检索,决定需要哪些数据行,然后从这些数据行中检索BLOB/TEXT的值.

把BLOB/TEXT列分离到单独的表中.减少主表中的碎片,也不会在SELECT * 进行查询时是一哦那个网络传输大量的BLOB/TEXT 值.

3.浮点数与定点数

浮点数,当精度超过实际定义的精度,会四舍五入,并不会报错.

定点数,实际是以字符串形式存放的,所以定点数可以更加精确的保存数据.

默认的SQLMode下会报警,但是还是会四舍五入进行保存;在传统模式(TRADITIONAL)的SQLMode下,会报错,无法插入.

浮点数,比如使用单精度float(10,2) 插入2.32 , 可能插入结果是2.31 ,所以浮点数会产生误差,这是浮点数特有的问题

因此精度要求比较高的场景,比如金融/货币,要使用定点数.

浮点数的比较也是一个普遍问题.编程中,尽量避免浮点数的比较,如果非要比较,也最好使用范围比较,而不是 '=='

Java中把浮点数转化为BigDecimal,在进行比较:

BigDecimal b1 = new BigDecimal(Double.toString(d1));

BigDecimal b2 = new BigDecimal(Double.toString(d2));

b1.subtract(b2).doubleValue();

4.日期类型的选择

根据场景,选择最小的存储日期类型.

如果只需要"年份",则使用1字节来存储YEAR类型,而不需要用4字节来存储DATE类型.

如果记录的年份比较久远,使用DATETIME , 而非TIMESTAMP.

如果记录的日期要让不同时区的用户使用,最好使用TIMESTAMP

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：android app性能标准 android性能优化总结

下一篇：condition python 场景 python combination

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

char mysql varchar 实例 mysql char()

char mysql varchar 实例 mysql char()

51CTO博客