人工标注

一、语义角色:

  • Agent:实施动作的主体
  • Action:谓语,动作
  • Patient:承受动作的客体
  • Time:发生动作的时间
  • Location:发生动作的地点

二、工具——label studio

官方网址:Open Source Data Labeling | Label Studio

使用工具:label studio

安装命令:pip install label-studio

启动命令:label-studio

访问API:http://localhost:8080

使用流程——关系抽取项目:

  1. 新建项目
  2. 输入 Project Name
  3. 输入 Description(可省略)

label-studio的简单使用_数据

  1. Labeling Setup栏目

选择自己需要的模块,这里选择Relation Extraction

  1. Natural Language Processing
  2. Relation Extraction
  3. add Label Name

label-studio的简单使用_数据_02

label-studio的简单使用_python_03

  1. Data Import
  2. Data Import栏目
  3. 导入要标注的数据文件.txt

label-studio的简单使用_python_04

  • 可以单击选择文件打开,也可以将文件拖入浏览器

label-studio的简单使用_数据文件_05

上述设置也可以在直接创建项目后的Settings中进行设置
projects / 测试项目 / Settings
General:设置项目名称和简述
Labeling Interface:
Browse Templates:选择模板
Add label names:添加标签
Labels:设置标签颜色,删除标签
可以在项目中的Import导入新的需要标注的数据文件

  1. 数据标注

Projects / 测试项目 / Labeling

  1. 选择任务
  2. 选择标签,对对应标签的数据进行拖选
  3. Submit\Update

label-studio的简单使用_数据_06

  1. 导出文件

projects / 测试项目

label-studio的简单使用_数据文件_07