一、需求:
某数据公司每日15:00~17:00之间,在其FTP发布当日数据供下载,我方需及时下载当日数据至指定本地目录。
二、分析:
1、需实现FTP登陆、查询、下载功能;
解答:使用内置的ftplib模块中FTP类;
2、需判断文件是否下载;
解答:使用os模块中path.exists方法;
3、需判断在指定时间段内才执行下载任务;
解答:使用内置的time模块抓取当前时间,并与指定时间做比较;
4、需考虑日期切换问题;
解答:使用内置的time模块抓取当前日期,并与变量中的日期做比较。
三、代码实现
1 #!/usr/bin/env python
2 # _*_ coding:utf-8 _*_
3
4 '''
5 @Time : 2019-11-11 13:30
6 @Author : Peanut_C
7 @FileName: ftp_auto_download.py
8 '''
9
10
11 import time
12 from ftplib import FTP
13 import os
14
15
16 remote_path = "/xxx/yy/z/" # 远端目录
17 begin_time = 1500 # 任务开始时间
18 end_time = 1700 # 任务结束时间
19
20
21 today = time.strftime("%Y%m%d") # 当天日期
22 today_file = today + 'test.txt' # 得到当天日期的目标文件名
23 remote_file = remote_path + today_file # 远端文件名
24 local_file = '\\\\local\\' + today + '\\' + today_file # 本地文件名
25 log_file = 'C:\\\\log\\ftp_log.txt'
26
27
28 def ftp_connect():
29 """用于FTP连接"""
30 ftp_server = 'w.x.y.z' # ftp站点对应的IP地址
31 username = 'ftpuser' # 用户名
32 password = 'ftppass' # 密码
33 ftp = FTP()
34 ftp.set_debuglevel(0) # 较高的级别方便排查问题
35 ftp.connect(ftp_server, 21)
36 ftp.login(username, password)
37 return ftp
38
39 def remote_file_exists():
40 """用于FTP站点目标文件存在检测"""
41 ftp = ftp_connect()
42 ftp.cwd(remote_path) # 进入目标目录
43 remote_file_names = ftp.nlst() # 获取文件列表
44 ftp.quit()
45 if today_file in remote_file_names:
46 return True
47 else:
48 return False
49
50 def download_file():
51 """用于目标文件下载"""
52 ftp = ftp_connect()
53 bufsize = 1024
54 fp = open(local_file, 'wb')
55 ftp.set_debuglevel(0) # 较高的级别方便排查问题
56 ftp.retrbinary('RETR ' + remote_file, fp.write, bufsize)
57 fp.close()
58 ftp.quit()
59
60
61 while True:
62 if int(time.strftime("%H%M")) in range(begin_time, end_time): # 判断是否在执行时间范围
63 if int(time.strftime("%Y%m%d")) - int(today) == 0: # 判断是否跨日期
64 while not os.path.exists(local_file): # 判断本地是否已有文件
65 if remote_file_exists(): # 判断远端是否已有文件
66 download_file()
67 with open(log_file, 'a') as f:
68 f.write('\n' + time.strftime("%Y/%m/%d %H:%M:%S") + " 今日文件已下载!")
69 time.sleep(60) # 下载完毕静默1分钟
70 else:
71 time.sleep(180)
72 break # 注意,此处跳出循环重新判断日期,避免周末或当天没文件时陷入内层循环
73 else:
74 time.sleep(180)
75 else:
76 """如果跨日期,则根据当前日期,更新各文件日期"""
77 today = time.strftime("%Y%m%d") # 当天日期
78 today_file = today + 'test.txt' # 得到当天日期的目标文件名
79 remote_file = remote_path + today_file # 远端文件名
80 local_file = '\\\\local\\' + today + '\\' + today_file # 本地文件名
81 with open(log_file, 'a') as f:
82 f.write('\n' + time.strftime("%Y/%m/%d %H:%M:%S") + " 任务启动, 文件日期已更新。")
83 else:
84 time.sleep(1800)
四、运行情况
保存为pyw文件,任务在后台持续运行,不需要计划任务,省心省力。
不用下载标记,一则较为简洁,二则本地文件如果被人误删或移动可自动重新下载。
日志中,每天仅写入任务启动和文件已下载标志,并记录对应时间,如有需要可再添加。