删除表中重复记录--转自博客园（LazyBee）

转载

mb5ff4099f0a555 2008-09-07 16:58:00

最近由于要给旧系统的表中增加主键（SQL Server2000的表），由于旧表中存在重复记录所以导致增加不上，所以需要写一段SQL语句来删除所有的重复记录（就是必须保留重复记录中的一条，维持数据记录的唯一性），我知道园子里大虾多，所以在这里集思广益，看看大家都有什么好的办法：

方法一：
1 为了保证完整性，首先启动一个事务

2 声明一个表变量（在这里使用表变量主要是考虑重复的数据不是很多，同时为了获得更好的性能；当然如果重复的数据特别多，使用临时表是更

好的选择，因为表变量的数据都是存在内存中的，如果数据量大，可能导致内存吃紧。）用于存储重复性的数据，这个需要定义成和源表一样。

3 将重复记录的一条插入到表变量中。

4 删除所有有重复记录的记录

5 将表变量中的记录插入的源表中。

6 如果出错，回滚事务，否则提交事务

以下是相应的sql语句块：

Begin Tran LazyBee
2 删除表中重复记录--转自博客园（LazyBee）_ico

declare @tmp Table
3 删除表中重复记录--转自博客园（LazyBee）_ico

(lLIstHeader_id int,lEncounter_id int,dtLastUpdate_dt datetime,
4 删除表中重复记录--转自博客园（LazyBee）_ico

sLastUpdate_id char(10),iConcurrency_id int)
5 删除表中重复记录--转自博客园（LazyBee）_ico

Insert @tmp(lLIstHeader_id,lEncounter_id,dtLastUpdate_dt,sLastUpdate_id,iConcurrency_id)
7 删除表中重复记录--转自博客园（LazyBee）_ico

select lListHeader_id,lEncounter_id,dtLastUpdate_dt,sLastUpdate_id,iConcurrency_id
8 删除表中重复记录--转自博客园（LazyBee）_ico

from lstHeaderencounter
9 删除表中重复记录--转自博客园（LazyBee）_ico

group by lListHeader_id,lEncounter_id,dtLastUpdate_dt,sLastUpdate_id,iConcurrency_id
10 删除表中重复记录--转自博客园（LazyBee）_ico

having count(*)>1
11 删除表中重复记录--转自博客园（LazyBee）_ico

delete lstHeaderencounter from @tmp d
13 删除表中重复记录--转自博客园（LazyBee）_ico

where d.lListHeader_id=lstHeaderencounter.lListHeader_id and
14 删除表中重复记录--转自博客园（LazyBee）_ico

d.lEncounter_id=lstHeaderencounter.lEncounter_id
15 删除表中重复记录--转自博客园（LazyBee）_ico

insert lstHeaderencounter(lLIstHeader_id,lEncounter_id,dtLastUpdate_dt,sLastUpdate_id,iConcurrency_id)
17 删除表中重复记录--转自博客园（LazyBee）_ico

select lListHeader_id,lEncounter_id,dtLastUpdate_dt,sLastUpdate_id,iConcurrency_id
18 删除表中重复记录--转自博客园（LazyBee）_ico

from @tmp
19 删除表中重复记录--转自博客园（LazyBee）_ico

if @@error<>0
21 删除表中重复记录--转自博客园（LazyBee）_ico

Begin
22

print ’roll back’
23 删除表中重复记录--转自博客园（LazyBee）_ico

RollBack Tran LazyBee
24 删除表中重复记录--转自博客园（LazyBee）_ico

End
25

else
26

Begin
27

print ’Success’
28 删除表中重复记录--转自博客园（LazyBee）_ico

Commit Tran LazyBee
29 删除表中重复记录--转自博客园（LazyBee）_ico

End
30

我知道这个方法不够通用，因为如果有多个类似重复记录的表存在，将每次都要修改表定义和插入语句的字段内容，不知各位有没有好的方法或意见，大家讨论讨论：）

刚在网上找到另外一些解决方案，感觉也挺不错的

方法二：

1 创建一个临时表，这个临时表的结构和源表一样

2 给这个临时表增加一个唯一索引（根据需要），并且选中忽略重复值

3 将源表的记录全部插入临时表中，这时会因为重复记录出现3604的错误。

4 删除源表的记录，将临时表的记录插入源表中，然后删除临时表。

方法三（主要针对重复记录完全相同的情况）：

1 利用distinct将唯一记录插入临时表中

2 然后将唯一记录再倒回源表中

Select distinct * into #Tmp from tableName
删除表中重复记录--转自博客园（LazyBee）_ico

Drop table tableName
删除表中重复记录--转自博客园（LazyBee）_ico

Select * into tableName from #Tmp
删除表中重复记录--转自博客园（LazyBee）_ico

Drop table #Tmp
删除表中重复记录--转自博客园（LazyBee）_ico

方法四（主要针对记录部分字段相同的记录）：

这种方法和方法一有点类似，不过实现方法不同而已。在这里使用了两个临时表.我们假设重复字段为lListHeader_id,lEncounter_id,要求得到这两

个字段的唯一结果集，我们保留重复记录的第一条，当然如果保留重复记录的最后一条可以使用max代替min：

Select identity(int,1,1) as autoID, * into #Tmp from tableName
删除表中重复记录--转自博客园（LazyBee）_ico

Select min(autoID) as autoID into #Tmp2 from #Tmp group by lListHeader_id,lEncounter_id
删除表中重复记录--转自博客园（LazyBee）_ico

Select * from #Tmp where autoID in (Select autoID from #Tmp2)

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：sql server 批量修改表和存储过程的所有者

下一篇：VS2005中安装AJAX

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

删除表中重复记录--转自博客园（LazyBee）

删除表中重复记录--转自博客园（LazyBee）

51CTO博客