char(或nchar)与varchar(或nvarchar)是数据库中最常见的用于存储字符数据的数据类型,由于它们在大多数特性相同,因此在选择用哪种类型存储数据时,可能会产生疑惑。

1.char与varchar的比较

(1)数据存储开销

●每个varchar列需要额外的两个字节,用于反映存储的数据的长度。

●每个可为NULL的char列,需要一些字节(空位图)来反应数据的为空性。

●无论实际数据的长度是多少,char按照定义的长度分配存储空间。

●varchar根据实际存储的数据的长度来分配数据存储空间。

●索引上的数据存储不需要额外的内部开销,索引数据的存储方式与数据页在数据的存储方式一样。

(2)NULL值

●char列的NULL值占用存储空间。

●varchar列的NULL值不占用存储空间。

●插入同样数量的NULL值,varchar列的插入效率明显高出char列。

(3)插入数据

无论插入数据涉及的列是否建立索引,char的效率都明显低于varchar。

(4)更新数据

●如果更新的列上未建立索引,则char的效率低于varchar,但效率差异不大。

●如果更新的列上建立索引,则char的效率低于varchar,并且效率差异很大。

(5)修改结构

●无论增加或删除的列的类型是char还是varchar,操作都能较快的完成,而且效率上没有什么差异。

●对于增加列的宽度而言,char与varchar有非常明显的效率差异,whntvarchar列基本上不花费时间,而修改char列需要花费很长的时间。

(6)数据检索

无论是否通过索引,varchar类型的数据检索略优于char的扫描。

2.选择char还是选择varchar的建议

(1)适宜使用char的情况

●列中的各行数据的长度基本一致,长度变化不超过50字节。

●数据变更频繁,数据检索的需求较少。

●列的长度不会经常变化,修改char类型列的宽度的代价比较大。

●列中不会出现大量的NULL值。

●列上不需要建立过多的索引,过多的索引对char列的数据变更影响较大。

(2)适宜使用varchar的情况

●列中的各行数据的长度差异比较大。

●列中数据的更新非常少,但查询非常频繁。

●列中经常没有数据,为NULL值或者为空值。

3.其他影响因素

(1)列是否允许NULL值

如果数据列定义为允许NULL值,则要分析NULL值在所有数据中所占的比例,定义char NULL的列时,需要额外的空间开销来反映值为NULL的情况,这会导致插入值时,也产生较多的空间分配,影响性能,当数据表中包含大量为NULL的记录时,这种性能的影响是比较明显的。

(2)磁盘空间开销

(3)内存大小

SQL Server以页为单位读取数据,数据占用的页越多,往往意味着内存的消耗也更高。当然,如果数据还未加载到内存中,则读取更多数据页也意味着更多的磁盘I/O。