python切割文件，我的闪亮"大马士革刀"表示不喜欢补刀！

原创

mb5fdcad8719a20 2021-03-10 08:53:36 ©著作权

文章标签 java 文章分类 Java 后端开发

©著作权归作者所有：来自51CTO博客作者mb5fdcad8719a20的原创作品，请联系作者获取转载授权，否则将追究法律责任

但是

我们切割文件后，要怎么样无须再动手去完善呢？要知道一个大脚本切割下来可能有10份以上，完善每个脚本的开头和收尾，还要标记这是第几个脚本，是一件非常繁琐耗时的事情。所以，安老师绝对不允许这样的事情出现，老铁们也一样，对不对！如果能一次性切割完成，究竟能带来什么好处呢？

1）拿来主义，省事，切割完成，直接用。

2）可标记脚本个数，便于管理和安排计划。

3）降低人为编辑错误的可能性。

大纲

1. 切割程序演示

2. 使用re模块

3. "一劳永逸"切割

切割程序演示

1. 演示场景

本次默认Windows切割文件，演示的图片如下

1.1 原文件

文件路径 F:\python\py自动化运维\公众号\5 python切割文件\test.sql

文件首部(图一,总1416行，此sql脚本为数据库劈2016年的月分区。)

python切割文件，我的闪亮"大马士革刀"表示不喜欢补刀！_java

文件尾部(图二)

python切割文件，我的闪亮"大马士革刀"表示不喜欢补刀！_java_02

2 使用程序演示

使用程序将上节推文的sql文件进行切割，可以看到该程序需要输入的信息有以下内容：

1）输入文件的绝对路径

2）每个新文件所需的行数

3）文件内容首部添加的内容

4）文件尾部添加的内容

5）生成文件的路径

使用re模块

1 正则表达式

2 利用re库处理正则表达式

正则表达式虽然本身比较复杂，但是python使用re标准库来处理它时却非常简单。

2.1 re库演示

re模块包含了正则表达式相关的函数、标志和一个异常。若希望在re模块在匹配时忽略字符的大小写可以添加标志，flags=re.IGNORECASE

"一劳永逸"切割

1 高级切割代码

 1# -*- coding: GB18030 -*-
 2import re
 3import os
 4import time
 5
 6def splitByLineCount(qianzhuitext,houzhuitext,filenamepath, count):
 7    global FILENAMELIST
 8    FILENAMELIST=[]
 9    filename = open(filenamepath, 'r')
10    try:
11        bufferline = []
12        num = 1
13        filename.seek(0)
14        for line in filename:
15            bufferline.append(line)
16            if len(bufferline) == count and num >=1 :
17                num = mkSubFile(qianzhuitext,houzhuitext,bufferline,filenamepath,num)
18                bufferline = []
19        if len(bufferline) != count and num >=1 :
20            num = mkSubFile(qianzhuitext,houzhuitext,bufferline,filenamepath,num)
21    finally:
22        filename.close()
23        return FILENAMELIST
24
25def mkSubFile(qianzhuitext,houzhuitext,bufferline,filenamepath,num):
26    [desfilename, typename] = os.path.splitext(filenamepath)
27    nfilename = desfilename + '_' + str(num) + typename
28    print('make file: %s' % nfilename)
29    scriptfile = open(nfilename, 'w')
30    try:
31        qianzhuitextnew = getnewqianzhui(qianzhuitext,num)
32        scriptfile.writelines(qianzhuitextnew)
33        scriptfile.writelines(bufferline)
34        scriptfile.writelines(houzhuitext)
35        return num + 1
36    finally:
37        scriptfile.close()
38        FILENAMELIST.append(nfilename)
39
40def getnewqianzhui(qianzhuitext,num):
41    global qianzhuitextnew
42    qianzhuitextnew=[]
43    f = open(r'F:\python\py自动化运维\公众号\5 python切割文件\qianzhui.txt',"w")
44    f.write(qianzhuitext)
45    f.close()
46    try:
47        fr = open(r'F:\python\py自动化运维\公众号\5 python切割文件\qianzhui.txt',"r")
48        for each in fr:
49            result = re.search(r"\.(log|sql|sh|py)",each.strip())
50            if result is not None:
51                neweach = each.replace(result.group(),"_"+str(num)+result.group())
52                qianzhuitextnew.append(neweach)
53            else:
54                neweach = each.strip() + '\n'
55                qianzhuitextnew.append(neweach)
56        fr.close()
57        return qianzhuitextnew
58
59    except Exception as e:
60        print('原因:', e)
61
62
63if __name__ == '__main__':
64    begin = time.time()
65    filenamepath = r'F:\python\py自动化运维\公众号\5 python切割文件\test.sql'
66    qianzhuitext= 'vi p_test_pmax_20190314.sh \n '\
67                  'sqlplus "/ as sysdba" << EOF \n '\
68                  'spool p_test_pmax_20190314.log \n '\
69                  'set time on \n'\
70                  'set timing on \n'\
71                  'set echo on\n \n'
72    houzhuitext = '\n<< EOF \n'\
73                  'exit \n'\
74                  '! \n '
75    splitByLineCount(qianzhuitext,houzhuitext,filenamepath, 500)
76    end = time.time()
77    print('time is %d seconds ' % (end - begin))