char(或nchar)与varchar(或nvarchar)是数据库中最常见的用于存储字符数据的数据类型,由于它们在大多数特性相同,因此在选择用哪种类型存储数据时,可能会产生疑惑。
1.char与varchar的比较
(1)数据存储开销
●每个varchar列需要额外的两个字节,用于反映存储的数据的长度。
●每个可为NULL的char列,需要一些字节(空位图)来反应数据的为空性。
●无论实际数据的长度是多少,char按照定义的长度分配存储空间。
●varchar根据实际存储的数据的长度来分配数据存储空间。
●索引上的数据存储不需要额外的内部开销,索引数据的存储方式与数据页在数据的存储方式一样。
(2)NULL值
●char列的NULL值占用存储空间。
●varchar列的NULL值不占用存储空间。
●插入同样数量的NULL值,varchar列的插入效率明显高出char列。
(3)插入数据
无论插入数据涉及的列是否建立索引,char的效率都明显低于varchar。
(4)更新数据
●如果更新的列上未建立索引,则char的效率低于varchar,但效率差异不大。
●如果更新的列上建立索引,则char的效率低于varchar,并且效率差异很大。
(5)修改结构
●无论增加或删除的列的类型是char还是varchar,操作都能较快的完成,而且效率上没有什么差异。
●对于增加列的宽度而言,char与varchar有非常明显的效率差异,whntvarchar列基本上不花费时间,而修改char列需要花费很长的时间。
(6)数据检索
无论是否通过索引,varchar类型的数据检索略优于char的扫描。
2.选择char还是选择varchar的建议
(1)适宜使用char的情况
●列中的各行数据的长度基本一致,长度变化不超过50字节。
●数据变更频繁,数据检索的需求较少。
●列的长度不会经常变化,修改char类型列的宽度的代价比较大。
●列中不会出现大量的NULL值。
●列上不需要建立过多的索引,过多的索引对char列的数据变更影响较大。
(2)适宜使用varchar的情况
●列中的各行数据的长度差异比较大。
●列中数据的更新非常少,但查询非常频繁。
●列中经常没有数据,为NULL值或者为空值。
3.其他影响因素
(1)列是否允许NULL值
如果数据列定义为允许NULL值,则要分析NULL值在所有数据中所占的比例,定义char NULL的列时,需要额外的空间开销来反映值为NULL的情况,这会导致插入值时,也产生较多的空间分配,影响性能,当数据表中包含大量为NULL的记录时,这种性能的影响是比较明显的。
(2)磁盘空间开销
(3)内存大小
SQL Server以页为单位读取数据,数据占用的页越多,往往意味着内存的消耗也更高。当然,如果数据还未加载到内存中,则读取更多数据页也意味着更多的磁盘I/O。