schem对比 scan和skim有什么区别

转载

mob6454cc7b8169 2024-05-01 20:48:36

文章标签 schem对比数据 SQL Server 文章分类 机器学习人工智能

SQL SERVER 使用扫描（scan）和查找（seek）这两种算法从数据表和索引中读取数据。这两种算法构成了查询的基础，几乎无处不在。Scan 会扫描并且返回整个表或整个索引。而 seek 则更有效率，根据谓词（predicate），只返索引内的一个或多个范围内的数据。下面将以如下的查询语句作为例子来分析 scan 和 seek：

select OrderDate from Orders where OrderKey = 2

Scan

使用 Scan 的方式，SQL Server 会去读取 Orders 表中的每一行数据，读取的时候评估是否满足谓词 “where order＝2”。如果满足（数据行符合条件），则返回该行。这个例子里，我们将这个谓词称作“residual predicate”。为了得到最优的性能，SQL 会尽可能地在扫描中使用“residual predicate”。但如果 residual predicate 的开销过于昂贵，SQL Server 可能会使用单独的“filter iterator”. “residual predicate”以 where 关键字的形式出现在文本格式的 plan 中。对 XML 格式的 plan，则是<predicate>标记的形式。

　　下面这个扫描的文本格式的 plan 的结果：

　　–Table Scan (OBJECT:([ORDERS])， WHERE:([ORDERKEY]=(2)))

　　下图说明了扫描的方式：

schem对比 scan和skim有什么区别_schem对比

无论数据行是否满足条件，扫描的读取方式都会访问表中的每一个数据，所以 scan 的成本和表的数据总量是成比例的。因此，如果表很小或者表内的大多数数据多满足谓词，scan 是一种有效率的读取方式。然而如果表很大或者绝大多数的数据并不满足谓词，那么这种方式会让我们访问到太多不需要的数据页面，并执行更多的额外的 IO 操作。

Seek

继续以上面的查询为例子，如果在 orderkey 列上有一个索引，那么 seek 可能会是一个好的选择。使用 seek 的访问方式，SQL Server 会使用索引直接导向到满足谓词条件的数据行。这个例子里，我们将这个谓词称为“seek predicate”。大多数情况下，SQL Server 不必将“seek predicate”重新评估为“residual predicate”。索引会保证“seek”只返回符合条件的数据行。“seek predicate”以 seek 关键字的形式出现在文本格式的 plan 中。对于 xml 格式的 plan,则以<seekpredicates>标记出现。

　　下面是使用 seek 的文本格式的 plan 的结果：

　　–Index Seek (OBJECT:([ORDERS].[OKEY_IDX])， SEEK:([ORDERKEY]=(2)) ORDERED FORWARD)

schem对比 scan和skim有什么区别_Server_02