在本教程中,您将学习如何比较两个表以查找不匹配的记录。
在数据迁移中,我们经常需要比较两个表,以识别一个表中的数据和在另一个表中没有相应记录的记录。
例如,我们有一个新的数据库,其模式与旧数据库不同。我们的任务是把旧数据库中的所有数据迁移到新数据库,并验证数据是否正确迁移。

要检查数据必须要比较两个表,在新数据库中和在旧数据库中数据,并识别不匹配的记录。

假设,我们有两个表:t1t2。 以下步骤比较两个表并识别不匹配的记录:
首先,使用UNION语句合并两个表中的行记录; 仅包含需要比较的列。返回结果集用于比较。

SELECT t1.pk, t1.c1
FROM t1
UNION ALL
SELECT t2.pk, t2.c1
FROM t2

第二,根据主键和需要比较的列对记录进行分组。如果需要比较的列中的值相同,则COUNT(*)返回2,否则COUNT(*)返回1

请参见以下查询:

SELECT pk, c1
FROM
 (
   SELECT t1.pk, t1.c1
   FROM t1
   UNION ALL
   SELECT t2.pk, t2.c1
   FROM t2
)  t
GROUP BY pk, c1
HAVING COUNT(*) = 1
ORDER BY pk

如果比较中涉及的列的值相同,则不返回任何行。

MySQL比较两个表的例子

让我们来看看一个模拟上述步骤的示例。
首先,创建具有相似结构的2个表:

CREATE TABLE studymysql.t1(
    id int auto_increment primary key,
    title varchar(255) 
);

CREATE TABLE studymysql.t2(
    id int auto_increment primary key,
    title varchar(255),
    note varchar(255)
);

第二步,向t1t2表中插入一些数据:

INSERT INTO studymysql.t1(title)
VALUES('第1行'),('第2行'),('第3行');

INSERT INTO studymysql.t2(title,note)
SELECT title, '数据迁移'
FROM studymysql.t1;

第三步,比较两个表的idtitle列的值:

SELECT id,title
FROM (
SELECT id, title FROM studymysql.t1
UNION ALL
SELECT id,title FROM studymysql.t2
) tbl
GROUP BY id, title
HAVING count(*) = 1
ORDER BY id;

执行上面查询,没有行返回,因为没有不匹配的记录。
第四步,向t2表中插入一个新行:

INSERT INTO studymysql.t2(title,note)
VALUES('第4行(新行)','新行');

第五,执行查询以再次比较两个表中的title列的值。上一步中插入的新行(即不匹配的行)应该会返回。结果如下所示 -

要查询整个表的分组比较情况,可参考下图 -

在本教程中,您已经学习了如何根据特定列来比较两个表,以查找不匹配的行记录。