一.前言

  由于种种原因,最近手头上有两份excel表格,我给两份表格分别命名为before.xlsx和now.xlsx.

  before.xlsx是组长一开始发给我的表,我在上面做了很多笔记,但是下午他剔了十几行又给我一个新的表格,也就是now.xlsx,这时候我就想到使用python来比较两个表格的不同。

  二.写代码

  1.首先,先导入库。(我用的是python3)

  

import xlrd
from xlwt import *

 

  2.定义函数。(根据文件名读取Excel表格,将某一列的数据存储到一个列表中,并返回它)

def read_excel(fileName):
    bk=xlrd.open_workbook(fileName)
    shxrange=range(bk.nsheets)
    try:
        sh=bk.sheet_by_name("Sheet1")#根据sheet1名字确定表格内容
    except:
        print ("代码出错")
    nrows=sh.nrows #获取行数
    li=[]
#定义一个空列表,以存储第二列的数据(哪一列都行,只要它具有唯一性)
    for i in range(1,nrows):
#对表格用行数进行遍历,存储到刚刚定义的li列表中,并返回它
        row_data=sh.row_values(i)
        value=sh.cell_value(i,1)
        li.append(value)
        return li

  3.对函数进行调用,两个文件名得到两个列表,对比两个列表的不同,存储到第三个列表中。(这个列表就是我们需要剔除的内容)

list1=list2=list3=list4=[]       
list1=read_excel('before.xlsx')
list2=read_excel('now.xlsx')
for i in list1:
    for j in list2:
        if i == j:
            list3.append(i)
 
for b in (list1 + list2):
    if b not in list3:
        list4.append(b) 
print(list3)#list3=list4,随意打印哪一个都行