向AI转型的程序员都关注了这个号????????????

机器学习AI算法工程  公众号:datayx

信息抽取(Information Extraction, IE)是从自然语言文本中抽取实体、属性、关系及事件等事实类信息的文本处理技术,是信息检索、智能问答、智能对话等人工智能应用的重要基础,一直受到业界的广泛关注。信息抽取任务涉及命名实体识别、指代消解、关系分类等复杂技术,极具挑战性。本次任务发布基于schema约束的SPO信息抽取任务,即在给定schema集合下,从自然语言文本中抽取出符合schema要求的SPO三元组知识。

信息抽取:SPO三元组知识_自然语言

数据简介

本次任务使用的SKE数据集是业界规模最大的基于schema的中文信息抽取数据集,其包含超过43万三元组数据、21万中文句子及50个已定义好的schema,表1中展示了SKE数据集中包含的50个schema及对应的例子。数据集中的句子来自百度百科和百度信息流文本。数据集划分为17万训练集,2万验证集和2万测试集。其中训练集和验证集用于训练,可供自由下载。

信息抽取:SPO三元组知识_三元组_02

相关项目代码 、数据集获取方式:

关注微信公众号 datayx  然后回复  三元组  即可获取。

AI项目体验地址 https://loveai.tech

信息抽取:SPO三元组知识_自然语言_03

信息抽取:SPO三元组知识_三元组_04

信息抽取:SPO三元组知识_三元组_05

信息抽取:SPO三元组知识_三元组_06

信息抽取:SPO三元组知识_三元组_07

信息抽取:SPO三元组知识_三元组_08

信息抽取:SPO三元组知识_三元组_09

信息抽取:SPO三元组知识_三元组_10

信息抽取:SPO三元组知识_数据集_11

信息抽取:SPO三元组知识_数据集_12

信息抽取:SPO三元组知识_自然语言_13

信息抽取:SPO三元组知识_三元组_14


不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

信息抽取:SPO三元组知识_数据集_15

长按图片,识别二维码,点关注

AI项目体验

​https://loveai.tech​

信息抽取:SPO三元组知识_自然语言_16