MySQL 大字段 mysql大字段存储

转载

jiecho 2023-06-20 08:50:45

文章标签 MySQL 大字段 mysql hive 字段数据 文章分类 MySQL 数据库

场景：

现在有个数据量大概40亿的数据，存在10个库，总计80张表上面，每个表大概5000万的数据量，
这个表通过一个MQ接口不断地接收数据，每天大概新增或更新数据量是几十万。

现在，需要在在这个表上加个新字段X，而且都有初始值，都存储在对方系统的数据库里。而他们这个新的字段一直就有。只是我方系统一直以来没有接这个字段。

注意：加字段期间不能影响原有的查这张表的业务的使用。

问：如何新增。

首先，肯定不能在表上面直接加字段，数据量太大，直接加字段，sql一夜都跑不完。而且会影响查询业务的使用

方案如下：

第一步，我们同样的数据库的位置，在老表的_old下方创建新表_new ，字段结构完全一样，只是多了新字段X。
第二步，让对方系统把老的40亿数据推到hive上面，做准备，时间节点记为1月1日零时，大概三天推上去；
第三步，在此之前，建立一个新接口，一个临时表new_temporary从1月1日零时，就开始接数据到临时表；
第四部，启动拉数据任务流，每天半夜从hive拉数据，拉倒新表new，拉的时候记得max_binlog_cache_size 改大，不然一次入库会撑爆，大概10天左右拉完，截止时间1月15日零时。（这个时间节点要用）

第五步，拉数据完毕后，启动一个定时任务，把从临时表new_temporary接收的数据，更新到新表_new。更新条件是，只对数据库更新时间是 1月15日零时之前的数据做更新
第六步，同时切换接口开关，关闭接临时表的接口，打开接新表接入数据的接口。同时入老表old的接口也不能关，预防漏发数据随时切回来。

第七步，修改系统中所有查询老表old查询方法，改成查询新表，用redis加上开关。上线功能。

第八步，打开开关，使用新表，若有漏发数据（少量），这提醒对方系统补发数据，逐步补全数据，

第九步，等系统运行平稳以后，关掉接老表old数据的接口，删除临时表new_temporary，删除老表_old

感悟：本来加一个字段不算太大的事，可是因为数据量大，又要保证可用性，所以还是需要一套方案来做这个事情。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。