范式与反范式
在设计数据库时,有范式和反范式的说法,下面总结一下各自的优缺点。
范式
优点:
1.范式化的更新通常比反范式更快
2.较好的范式化后,很少或没有重复的数据
3.范式数据比较小,可以放内存里,操作快
4.很少的冗余数据,在查询的时候需要更少的distinct或者group by语句。
缺点:
范式化的表,在查询的时候经常需要很多的关联,因为单独一个表内不存在冗余和重复数据。这导致,稍微复杂一些的查询语句在查询范式的schema上都可能需要较多次的关联。这会增加让查询的代价,也可能使一些索引策略无效。因为范式化将列存放在不同的表中,而这些列在一个表中本可以属于同一个索引。
反范式
优点:
1.所有数据都在一张表,可以避免关联
2.可以设计有效的索引;
缺点:
表内冗余多,删除时容易造成有效数据丢失
实际使用过程当中一般范式反范式配合使用
主键选择
主键一般分为 代理主键,自然主键
代理主键
与业务无关的,无意识的数字序列
自然主键
事务属性中的自然唯一标识
推荐使用代理主键:
1.与业务不耦合,因此更容易维护
2.一个大多数表,最好是全部表,通用的key策略可以减少需要编写的代码数量,减少系统总成本