上次文章从广泛意义上说了结构化预测【见下文】闲聊结构化预测(structured learning)【这是一类问题】 本文聊一下自然语言处理中的结构化预测问题。

Structured Prediction

一开始还是说一下结构化预测的概念,结构化预测不是输出一个标量(回归问题)或者一个类别(分类问题),而是输出一个结构,树、图或者其它序列能够互相影响彼此。

在自然语言处理中,结构化预测问题有以下几种:

  • Sequence segmentation
  • Sequence labeling / Tagging
  • Parsing 下面来分开举例

Sequence Segmentation

序列分割,指的是将一个序列分割为连续的片段。

更广泛的有句子分割,段落分割,他们的输出片段与片段直接其实是互相联系,全部构成一个整体sequence。

Sequence Labeling / Tagging

序列标注是一类问题,是对一个序列的每个word打上一个标签,在nlp中非常多的任务都可以转为序列标注任务,这里不是重点,只是说序列标注是结构化预测问题。序列标注问题还有:

以上任务均可以转化为序列标注任务,然后通过一定的解码算法就能得到需要的结果,它们是结构化预测问题,不是简单回归或者分类问题。

Parsing Algorithm

最后一类问题是parsing问题,对句法分析的介绍可以看:

上面两篇文章(知乎搜索相关关键字即可!) 本篇文章主要总结了在自然语言处理方向的结构化预测问题,每一类问题其实都可以展开讲解,欢迎大家交流!

所以ppt来自哈工大车万翔老师slides

推荐阅读:

【荐号】汇集百万粉丝的个人技术号 我就不信看完这篇你还搞不懂信息熵 通俗易懂讲解感知机(三)--收敛性证明与对偶形式以及python代码讲解