(一)核心原则

(1)不在数据库做运算

cpu计算务必移至业务层;

(2)控制单表数据量

int型不超过1000w,含char则不超过500w;合理分表;限制单库表数量在300以内;

(3)控制列数量

字段少而精,字段数建议在20以内;

(4)平衡范式与冗余

效率优先;往往牺牲范式;

(5)拒绝3B

拒绝大sql语句:big sql
拒绝大事物:big transaction
拒绝大批量:big batch

(二)字段类原则

(6)用好数值类型

tinyint(1Byte)
smallint(2Byte)
mediumint(3Byte)
int(4Byte)
bigint(8Byte)
bad case:int(1)/int(11)

(7)字符转化为数字

用int而不是char(15)存储ip

(8)优先使用enum或set

例如:`sex` enum (‘F’, ‘M’)

(9)避免使用NULL字段

NULL字段很难查询优化;
NULL字段的索引需要额外空间;
NULL字段的复合索引无效;
bad case:
`name` char(32) default null
`age` int not null
good case:
`age` int not null default 0

(10)少用text/blob

varchar的性能会比text高很多;实在避免不了blob,请拆表;

(11)不在数据库里存图片

这个我不能理解!但这是赶集网的经验,求detail!

(三)索引类原则

(12)谨慎合理使用索引

改善查询、减慢更新;索引一定不是越多越好(能不加就不加,要加的一定得加);覆盖记录条数过多不适合建索引,例如“性别”;

(13)字符字段必须建前缀索引

(14)不在索引做列运算

!!!不只是索引,都不能做列运算吧!!!
bad case:
select id where age +1 = 10;

(15)innodb主键推荐使用自增列;

主键建立聚簇索引;主键不应该被修改;字符串不应该做主键;如果不指定主键,innodb会使用唯一且非空值索引代替;

(16)不用外键

请由程序保证约束;

(四)sql类原则

(17)sql语句尽可能简单

一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库;

(18)简单的事务

事务时间尽可能短;
bad case:
上传图片事务

(19)避免使用trig/func

触发器、函数不用;客户端程序取而代之;

(20)不用select *

消耗cpu,io,内存,带宽;这种程序不具有扩展性;

(21)OR改写为IN()

or的效率是n级别;
in的消息时log(n)级别;
in的个数建议控制在200以内;
select id from t where phone=’159′ or phone=’136′;
=>
select id from t where phone in (’159′, ’136′);

    (22)OR改写为UNION

mysql的索引合并很弱智
select id from t where phone = ’159′ or name = ‘john’;
=>
select id from t where phone=’159′
union
select id from t where name=’jonh’

    

(23)避免负向%

(24)慎用count(*)

(25)limit高效分页

limit越大,效率越低
select id from t limit 10000, 10;
=>
select id from t where id > 10000 limit 10;

    

(26)使用union all替代union

union有去重开销

(27)少用连接join

(28)使用group by

分组;自动排序;

(29)请使用同类型比较

(30)使用load data导数据

load data比insert快约20倍;

(31)打散批量更新

(32)新能分析工具

show profile;
mysqlsla;
mysqldumpslow;
explain;
show slow log;
show processlist;
show query_response_time(percona)

 原文 http://www.html5wd.com/archives/1090.html