文章目录

  • 1. 问题现象
  • 2. 解决方案
  • 3. 几种设置字符集的方式和对比


1. 问题现象

最近出现程序在运行一段时间之后,新入到MySQL中的数据出现中文乱码,每次重启程序就会好,然后过段时间又会出现问题?

2. 解决方案

经过排查怀疑是因为在程序入库程序执行中途,出现过与MySQL自动重连的操作,在自动重连以后所有配置都会使用默认的,所以字符集也相应会变成默认,而不再是刚开始建立连接时使用的UTF-8。
在引擎中当前与MySQL建立连接时用到的主要API函数如下:

//1. 设置连接参数
int mysql_options(MYSQL *mysql, enum mysql_option option, const char *arg)

//2. 设置字符集
ret = mysql_real_query(mysql, "SET NAMES UTF8;",    (unsigned long) strlen ("SET NAMES UTF8;"));  

//3. 与MySQL建立连接
MYSQL *mysql_real_connect (MYSQL *mysql,
    const char *host,
    const char *user, 
    const char *passwd, 
    const char *db, 
    unsigned int port,
    const char *unix_socket,
    unsigned long client_flag);

以上的第2步中使用命令行的方式设置字符集编码后,如果中途出现自动重连的会恢复到默认字符集。所以修改为如下API设置:

//2. 设置连接字符集
int mysql_set_character_set(MYSQL *mysql, char *csname)

3. 几种设置字符集的方式和对比

mysql在C/C++中调用api设置连接mysql的编码方式有以下几种方法:1. mysqli_set_charset调用示例:

ret = mysql_set_character_set(mysql, "utf8");

说明:
推荐使用的设置方法,与mysql的连接断开自动重连后仍能保持设置的编码格式,并且影响mysql_real_escape_string函数功能,使mysql_real_escape_string函数使用设置的编码格式转义字符串。
但该函数在mysql5.0.5版本以后才支持,故版本太低者…。2. 执行sql语句:SET NAMES
调用示例:

ret = mysql_real_query(mysql, "SET NAMES UTF8;",    (unsigned long) strlen ("SET NAMES UTF8;"));

说明:
使用sql语句执行,只能影响当前与数据库的连接,断开自动重连后编码格式会重置为默认的配置。3. 设置MYSQL_SET_CHARSET_NAME属性
调用示例:

ret = mysql_options(mysql, MYSQL_SET_CHARSET_NAME, "utf8");

说明:
跟mysql_set_character_set类似,断开自动重连后仍能保持设置的编码格式,只是不会影响到mysql_real_escape_string函数。
并且在mysql5.0.5版本都可以使用,低版本可以使用该方法代替。
需要特别说明的是只有在调用mysql_real_connect连接数据库之前修改该属性才会生效。