NLP工具 识别姓名 nlp图片识别分类_NLP工具 识别姓名


摘要

本文介绍基于NLP领域多方式融合方法进行关于图文方面的内容理解和应用。

一、简介

图文内容标签有三个典型的应用场景[1]

第一,个性化推荐,通过对内容进行标签提取,结合用户的兴趣TAG,对用户进行精准的个性化推荐,是内容标签在个性化推荐上面的一个典型的应用。

第二,搜索,通过内容的关键词或者内容标签,跟用户输入的关键词做精准匹配,返回更精确的搜索结果。

第三,标签提取,使用内容标签作为文本特征,来提升聚类或分类的效果。当前主要内容推荐领域图文标签使用形式一般是 一级、二级标签+三级多tag形式。

提取内容标签的方法在这里总结为3大类方法:第一类是抽取式,本质是从文本中抽取关键词或者短语;第二类是生成式,通过生成的方式,来生成关键词和短语;第三类是判别式,即设定标签集合使用多分类方式进行打标操作。


NLP工具 识别姓名 nlp图片识别分类_NLP工具 识别姓名_02


二、一/二级标签

一/二级标签包括单标签和多标签形态基本上来说还是简单的,特别是bert模型这种大规模预训练模型出来以后大大降低了NLP领域中这种小规模固定标签集合的分类问题的难度。

但仍然有几点值得一提:

  • 数据处理:这一点很重要很有效;这里关于非均衡样本的处理方式,就使用正常的样本增强手段处理即可;
  • 模型设计及选择:数据很重要但并非像部分人说的算法工程师就是在处理数据。私以为数据处理虽然有效但是简单并不是算法工程师独有的特征(至少数据分析师是可以做到的),但是根据实际问题来选择模型甚至设计特定网络,这是算法工程师的特征能力。

是否可以结合一级/二级标签的联系,不论是相似性或者上下层级关系来设计网络,训练模型以提升模型效果?【后续有时间再补充方案】

三、三级多tag

关于三级标签,这样的标签集合往往非常的大,我们很容易产生一个朴素的思想:能否按照某种方式分拆分,筛选,圈定

首先,文本不同于视频图像,NLP领域处理的大多数问题是特征空间和标注空间是同一个空间的问题,这样就会大大简化问题同时也提供了一些不一样的处理思路:我们可以将万级的标签分为 实体标签和抽象标签

  • 实体标签

关于实体标签,直接使用bert-bilstm-crf模型就能达到较好的效果,模型服务的输出结果接入pipline 与抽象标签结果进行拼接。

  • 抽象标签

抽象标签的处理也存在一个基础标签集合圈定的步骤,除了样本处理,还是应该主要考虑模型设计的问题:

当然可以直接使用albert模型进行多标签分类操作,但由于特征空间都一样不像视频那样可以有不同数据源进行相互补充,效果上限可见;

这里推荐一个多标签召回+文本相似度匹配的融合方案,可以达到较好的效果【方案图后续有时间补充】

四、图文内容标签应用

最后给大家介绍一下图文内容标签的一些应用:

1)个性化推荐包括信息流推荐、广告推荐等,理解用户也就是用户打一些兴趣标签,兴趣标签是多个维度,其中内容标签是细粒度兴趣标签中最重要的一种标签;然后是理解内容生成内容标签,根据内容标签做召回和排序。[1]

2)智能搜索,内容标签在搜索方面也是有较多的应用。比如Query扩展:通过Query和点击过的短视频的内容标签做一个影射,然后训练一个端到端的生成模型,来生成输入Query的扩展Query。Query推荐:通过生成Query的内容标签,和用户的兴趣标签做匹配,用来做Query推荐中的召回和排序。

3)query标签等,单独拆出来这个,主要是query是用户主动的行为结果,可以更加主动地反馈用户意图和兴趣,同时这种数据又会比文章数据来的短小且含噪声,需要不同的处理。当然最终的目标是为了打标支持用户兴趣标签或者圈定目标用户,跟搜索还是有很大区别的。

参考文献

[1] 公开课笔记 | 多模态短视频内容标签技术及应用: https://mp.weixin.qq.com/s/CEPBXaJfrIO1w0yX7YdZZA

[2] BERT:Bidirectional Encoder Representation from Transformers;