背景:大约有3K家商家需要重新确认信息并签订合同。合同是统一的Word版本。每个供应商需要修改合同内的金额部分。人工处理方式需要每个复制粘贴且金额要生成大写金额。基于重复工作可偷懒。用Python解救一下。
#导入对应数据库
import numpy as np
import pandas as pd
import os
import docx
from docx.shared import Pt
from docx.oxml.ns import qn
#修改项目文件地址
os.chdir(r'C:\Users\WIN7\Desktop\分期账单自动化')
os.getcwd()
'''
人民币数字转大写汉字
'''
# coding: utf-8
import warnings
from decimal import Decimal
def cncurrency(value, capital=True, prefix=False, classical=None):
‘’’
参数:
capital: True 大写汉字金额
False 一般汉字金额
classical: True 元
False 圆
prefix: True 以’人民币’开头
False, 无开头
‘’’
if not isinstance(value, (Decimal, str, int)):
msg = ‘’’
由于浮点数精度问题,请考虑使用字符串,或者 decimal.Decimal 类。
因使用浮点数造成误差而带来的可能风险和损失作者概不负责。
‘’’
warnings.warn(msg, UserWarning)
默认大写金额用圆,一般汉字金额用元
if classical is None:
classical = True if capital else False
汉字金额前缀
if prefix is True:
prefix = ‘人民币’
else:
prefix = ‘’
汉字金额字符定义
dunit = (‘角’, ‘分’)
if capital:
num = (‘零’, ‘壹’, ‘贰’, ‘叁’, ‘肆’, ‘伍’, ‘陆’, ‘柒’, ‘捌’, ‘玖’)
iunit = [None, ‘拾’, ‘佰’, ‘仟’, ‘万’, ‘拾’, ‘佰’, ‘仟’,‘亿’, ‘拾’, ‘佰’, ‘仟’, ‘万’, ‘拾’, ‘佰’, ‘仟’]
else:
num = (‘〇’, ‘一’, ‘二’, ‘三’, ‘四’, ‘五’, ‘六’, ‘七’, ‘八’, ‘九’)
iunit = [None, ‘十’, ‘百’, ‘千’, ‘万’, ‘十’, ‘百’, ‘千’,‘亿’, ‘十’, ‘百’, ‘千’, ‘万’, ‘十’, ‘百’, ‘千’]
if classical:
iunit[0] = ‘元’ if classical else ‘圆’
转换为Decimal,并截断多余小数
if not isinstance(value, Decimal):
value = Decimal(value).quantize(Decimal(‘0.01’))
处理负数
if value < 0:
prefix += ‘负’ # 输出前缀,加负
value = - value # 取正数部分,无须过多考虑正负数舍入
# assert - value + value == 0
转化为字符串
s = str(value)
if len(s) > 19:
raise ValueError(‘金额太大了,不知道该怎么表达。’)
istr, dstr = s.split(’.’) # 小数部分和整数部分分别处理
istr = istr[::-1] # 翻转整数部分字符串
so = [] # 用于记录转换结果
零
if value == 0:
return prefix + num[0] + iunit[0]
haszero = False # 用于标记零的使用
if dstr == ‘00’:
haszero = True # 如果无小数部分,则标记加过零,避免出现“圆零整”
处理小数部分
分
if dstr[1] != ‘0’:
so.append(dunit[1])
so.append(num[int(dstr[1])])
else:
so.append(‘整’) # 无分,则加“整”
角
if dstr[0] != ‘0’:
so.append(dunit[0])
so.append(num[int(dstr[0])])
elif dstr[1] != ‘0’:
so.append(num[0]) # 无角有分,添加“零”
haszero = True # 标记加过零了
无整数部分
if istr == ‘0’:
if haszero: # 既然无整数部分,那么去掉角位置上的零
so.pop()
so.append(prefix) # 加前缀
so.reverse() # 翻转
return ‘’.join(so)
处理整数部分
for i, n in enumerate(istr):
n = int(n)
if i % 4 == 0: # 在圆、万、亿等位上,即使是零,也必须有单位
if i == 8 and so[-1] == iunit[4]: # 亿和万之间全部为零的情况
so.pop() # 去掉万
so.append(iunit[i])
if n == 0: # 处理这些位上为零的情况
if not haszero: # 如果以前没有加过零
so.insert(-1, num[0]) # 则在单位后面加零
haszero = True # 标记加过零了
else: # 处理不为零的情况
so.append(num[n])
haszero = False # 重新开始标记加零的情况
else: # 在其他位置上
if n != 0: # 不为零的情况
so.append(iunit[i])
so.append(num[n])
haszero = False # 重新开始标记加零的情况
else: # 处理为零的情况
if not haszero: # 如果以前没有加过零
so.append(num[0])
haszero = True
最终结果
so.append(prefix)
so.reverse()
return ‘’.join(so)
#数据准备阶段 导入大写
#读取预备好的EXCEL表格
text = pd.read_excel('付款预备表.xlsx')
#print(text)
text['EC总应付额']
list1 = []
for i in text['EC总应付额']:
list1.append(cncurrency(str(i)))
text.append(list1)
text['大写金额'] = list1
text.shape[0]
print(text.head())
document12 = docx.Document('分期SPM模板(12期).docx')
document24 = docx.Document('分期SPM模板(24期).docx')
supp_num = 0
for supp_num in range(text.shape[0]):
paragraph_num = 0
A = text.iat[supp_num,2]
B = text.iat[supp_num,5]
qishu = text.iat[supp_num,3]
supp_name = text.iat[supp_num,1]
user_name = text.iat[supp_num,4]
content = "双方确认,截止至 2020 年 3 月 31 日,扣除原合同和原合作约定到货异常(包括但不仅限于缺货、少货、货损、到货不符)、违约责任、赔偿责任、甲方代乙方垫付等所涉相关费用后,甲方尚欠付乙方货款金额合计人民币{}元(大写:{})。".format(A,B)
if qishu == "12期":
p = document12.paragraphs[8].clear()
run1 = p.add_run(content)
run1.font.size = Pt(12)
run1.font.name = '仿宋'
run1.element.rPr.rFonts.set(qn('w:eastAsia'), '仿宋')
document12.save("{}.docx".format(supp_name))
else:
p = document24.paragraphs[8].clear()
run1 = p.add_run(content)
run1.font.size = Pt(12)
run1.font.name = '仿宋'
run1.element.rPr.rFonts.set(qn('w:eastAsia'), '仿宋')
document24.save("{}.docx".format(supp_name))
主要是分成四个板块。
一:导入相关的包,这个就不说了
二:数字金额转大写金额。这个网上一大堆的现成的函数,也就不用自己写,Copy测试一下,OK的。
三:预备自己的数据。
四:本来想替换指定位置的内容的,但是发现操作相对有点困难,那就思维放大,直接替换整个段落。用个format,把需要替换的内容直接填入。然后用docx包里面的.clear【清除段落】 加 add_run【添加段落】的方式,配合上.font.size 和.font.name 调整字体大小与字体。最后save就OJBK了。