在数据库的操作中,我们经常会遇到乱码的问题,确实令人很心烦,虽然还没有完全弄明白其中的一些原理,但是有一些经验到是可以总结一下,指导一下后来者。
一般我们在安排向导中最好设置数据库的统一编码方式为utf-8(当然,以后在自己的工程中做到处处统一为utf8),这样到是可以省去不少的麻烦。
当mysql向导配置完成后,进入数据库,执行 show variables like '%char%',对应显示的结果应该都对应为utf-8
但尽管如此,但我们利用command line client工具在表中插入中文的时候,会遇到data too long或者提示字符串Incorrect string value的问题,导致插入失败。
出现这个问题的原因是因为我们系统默认的编码方式为gbk(一般windows),所以对应的command line client接受的也是gbk的文本,但是mysql的connection的编码方式为utf8,而貌似mysql没有自动编码转化的功能,所以就出现不能识别的编码问题,导致插入失败。
解决方法就是在cmd下登陆command line client时使用:mysql -uroot -p --default-character-set=gbk; 这时在command line client下就能正常插入中文了。
同时在执行show variables like '%char%'语句时,出现了
这时发现对应几处的编码“暂时”(实际上,再次登陆后,查询时是没有变化的)改变了,这表示在这种方式进入的环境下,就可以与系统默认的编码吻合起来了,就可以正常地插入中文了。
对于不能插入的问题(当然包括在导入的操作),其中重点要关注和思考在两个方面上,一个是客户端面character_set_client和连接character_set_connection和返回的结果集character_set_results这其中涉及到与当前系统环境进行想到的环节,理解这其中的关系,或许就不会那么迷茫了。
还有,如果在一些mysql的图形化操作界面执行插入中文,则直接不会遇到这些问题,因为我们避免一个与系统有直接关系的输入client.
这是我在遇到这个问题的一点点思考,希望能给大家一些启发。
过去在不明白的时候,总是在网上找别人给的解决方案,总是在碰运气,最后即便是解决了问题,但还是不明白原理,并最终又在这上面出了问题,一句话说得好,有些东西不懂迟早还是要还的。所以我觉得,如果不是很非常关键,静下心来理理,把问题真正弄懂,才是最好的,也是最有成就感的。