人工标注
一、语义角色:
- Agent:实施动作的主体
- Action:谓语,动作
- Patient:承受动作的客体
- Time:发生动作的时间
- Location:发生动作的地点
二、工具——label studio
官方网址:Open Source Data Labeling | Label Studio
使用工具:label studio
安装命令:pip install label-studio
启动命令:label-studio
访问API:http://localhost:8080
使用流程——关系抽取项目:
- 新建项目
- 输入 Project Name
- 输入 Description(可省略)
- Labeling Setup栏目
选择自己需要的模块,这里选择Relation Extraction
- Natural Language Processing
- Relation Extraction
- add Label Name
- Data Import
- Data Import栏目
- 导入要标注的数据文件.txt
- 可以单击选择文件打开,也可以将文件拖入浏览器
上述设置也可以在直接创建项目后的Settings中进行设置
projects / 测试项目 / Settings
General:设置项目名称和简述
Labeling Interface:
Browse Templates:选择模板
Add label names:添加标签
Labels:设置标签颜色,删除标签
可以在项目中的Import导入新的需要标注的数据文件
- 数据标注
Projects / 测试项目 / Labeling
- 选择任务
- 选择标签,对对应标签的数据进行拖选
- Submit\Update
- 导出文件
projects / 测试项目