在本教程中,您将学习如何比较两个表以查找不匹配的记录。
在数据迁移中,我们经常需要比较两个表,以识别一个表中的数据和在另一个表中没有相应记录的记录。
例如,我们有一个新的数据库,其模式与旧数据库不同。我们的任务是把旧数据库中的所有数据迁移到新数据库,并验证数据是否正确迁移。
要检查数据必须要比较两个表,在新数据库中和在旧数据库中数据,并识别不匹配的记录。
假设,我们有两个表:t1
和t2
。 以下步骤比较两个表并识别不匹配的记录:
首先,使用UNION语句合并两个表中的行记录; 仅包含需要比较的列。返回结果集用于比较。
SELECT t1.pk, t1.c1
FROM t1
UNION ALL
SELECT t2.pk, t2.c1
FROM t2
第二,根据主键和需要比较的列对记录进行分组。如果需要比较的列中的值相同,则COUNT(*)
返回2
,否则COUNT(*)
返回1
。
请参见以下查询:
SELECT pk, c1
FROM
(
SELECT t1.pk, t1.c1
FROM t1
UNION ALL
SELECT t2.pk, t2.c1
FROM t2
) t
GROUP BY pk, c1
HAVING COUNT(*) = 1
ORDER BY pk
如果比较中涉及的列的值相同,则不返回任何行。
MySQL比较两个表的例子
让我们来看看一个模拟上述步骤的示例。
首先,创建具有相似结构的2
个表:
CREATE TABLE studymysql.t1(
id int auto_increment primary key,
title varchar(255)
);
CREATE TABLE studymysql.t2(
id int auto_increment primary key,
title varchar(255),
note varchar(255)
);
第二步,向t1
和t2
表中插入一些数据:
INSERT INTO studymysql.t1(title)
VALUES('第1行'),('第2行'),('第3行');
INSERT INTO studymysql.t2(title,note)
SELECT title, '数据迁移'
FROM studymysql.t1;
第三步,比较两个表的id
和title
列的值:
SELECT id,title
FROM (
SELECT id, title FROM studymysql.t1
UNION ALL
SELECT id,title FROM studymysql.t2
) tbl
GROUP BY id, title
HAVING count(*) = 1
ORDER BY id;
执行上面查询,没有行返回,因为没有不匹配的记录。
第四步,向t2
表中插入一个新行:
INSERT INTO studymysql.t2(title,note)
VALUES('第4行(新行)','新行');
第五,执行查询以再次比较两个表中的title
列的值。上一步中插入的新行(即不匹配的行)应该会返回。结果如下所示 -
要查询整个表的分组比较情况,可参考下图 -
在本教程中,您已经学习了如何根据特定列来比较两个表,以查找不匹配的行记录。