一个python工程,以UDA为例一般有以下构成:
main.py作为工程的主文件或者部署服务的文件
uda.py 作为算法文件
preprocess.py进行预处理
utils文件夹存放一些工具脚本,比如格式转化,分词等,并且加一个文件__init__.py,使用的时候from utils import xxx
scripts文件夹,存放一些.sh脚本,用来下载数据、训练等等
data或corpus文件夹,用来存放训练数据
如果有额外的模块,可以再建一个文件夹比如augmentation,加上__init__.py,专门用来进行数据增强