一、内容概要Photo OCRProblem Decription and pipeline(问题描述和流程图)Sliding Windows(滑动窗口)Getting Lots of Data and Artificial DataCeiling Analysis(上限分析):What part of the pipline to Work on Next二、重点&难点1. Proble            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-23 20:20:39
                            
                                77阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            在中文自然语言处理(NLP)中,主体识别(Entity Recognition)是一个非常重要的任务,旨在识别文本中的关键信息,比如人名、地名、组织名等。在这篇博文中,我将分享如何解决中文NLP主体识别问题的整个过程,包括环境准备、集成步骤、配置详解、实战应用、排错指南和性能优化。
### 环境准备
首先,我们需要准备一个适合进行中文NLP主体识别的环境。这包括Python的安装、所需库的依赖            
                
         
            
            
            
            1 引言  主题模型是文本挖掘的重要工具,近年来在学术界和工业届都获得了非常多的关注。学术界的工作主要集中在建模层面,即提出各种各样的主题模型来适应不同的场景,因此缺乏指导主题模型在工业场景落地的资源和文献。  本文主要是以《Familia:开源的中文主题模型应用工具包》为参考资料,入门NLP领域。该文结合开源工具Familia(百度开源),总结主题模型在工业届的一些典型应用案例,从而方便用户找到            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-05 19:47:53
                            
                                75阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            前言近期模拟了一个百度AI——图片多主体识别的demo,使用了canvas实现这个功能。相信前端的同事对canvas都不算陌生,那我们就用canvas来看看这个功能是怎么实现的吧。什么是canvas。canvas是html5的一个新标签,属于h5的新特性canvas标签是一个图形的容器,简单点说就是一块画布,你可以在上画矩形,圆形,三角形,折线等等,也可以用来画logo它是通过javascript            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-10-22 10:43:04
                            
                                43阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # NLP抽取语句中的主体
自然语言处理(NLP)是计算机科学和人工智能的一个重要分支,它涉及对自然语言的理解和生成人类可读的回应。抽取句子中的主体(Subject Extraction)是NLP中的一个关键任务,旨在从句子中识别出主要的参与者或主题。本文将介绍如何实现这一目标,并通过示例代码来说明基本的实现过程。
## 什么是主体抽取?
在一个句子中,主体通常是执行动作的人或事物。例如,在            
                
         
            
            
            
            文章目录第一部分:文本分类一、文本预处理(解决特征空间高维性、语义相关性和特征分布稀疏)二、文本特征提取三、分类模型第二部分:情感分析一、概述二、基于情感词典的情感分类方法三、基于机器学习的情感分类方法第三部分:意图识别一、概述二、意图识别的基本方法三、意图识别的难点 第一部分:文本分类训练文本分类器过程见下图:文本分类问题: 给定文档p(可能含有标题t),将文档分类为n个类别中的一个或            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-31 18:21:49
                            
                                329阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
              nlp领域里,语义理解仍然是难题!  给你一篇文章或者一个句子,人们在理解这些句子时,头脑中会进行上下文的搜索和知识联想。通常情况下,人在理解语义时头脑中会搜寻与之相关的知识。知识图谱的创始人人为,构成这个世界的是实体,而不是字符串,这从根本上改变了过去搜索的体系。语义理解其实是基于知识,概念和这些概念间的关系。人们在解答问题时,往往会讲述与这个问题相关的知识,这是语义理解的过程。这种机制完全            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-02 22:19:13
                            
                                162阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # 使用Python识别图片主体颜色
在当今的数字时代,处理和分析图像数据变得越来越重要。当我们谈论到“识别图片主体颜色”时,实际上是指从图片中提取主要颜色并进行可视化展示。本文将会带你逐步完成这一过程,并最终用饼状图展示主体颜色比例。
## 整体流程
下面是实现“识别图片主体颜色”的流程图:
| 步骤 | 描述                                     |            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-08-11 04:35:24
                            
                                149阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # 自然语言处理中的主体客体抽取算法
自然语言处理(NLP)是人工智能领域的一个重要分支,旨在让计算机理解和处理人类语言。在众多NLP任务中,主体客体抽取(也称为实体识别或关系抽取)尤为关键。本文将探讨几种主体客体抽取算法,并提供相关的代码示例。
## 1. 主体客体抽取的定义
主体客体抽取是指从文本中识别出主体(通常是名词或名词短语)和客体(通常是动词或其他名词短语),这些实体之间通常存在            
                
         
            
            
            
            与计算机视觉相比,自然语言处理 (NLP) 一直被认为是一个难以攻克的难题。本文寻找到了一种新的 NLP 处理方式,探索将 NLP 与计算机视觉处理结合,将文本绘制成图片。虽然目前的准确率还有待优化提高,但看起来很有应用前景。问题点长期以来,自然语言处理 (NLP) 一直被认为是一个难以攻克的难题,至少与计算机视觉相比是这样。NLP 模型需要更长的运行时间,通常更难实现,并且需要更多的计算资源。另            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-19 11:14:56
                            
                                81阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            坐落在北京西山凤凰岭山脚下的龙泉寺,可以称得上是全国甚至全球科研实力最强的佛教寺庙。寺内高僧们搞科研、写代码,将佛学与新技术相结合,成果不断,持续被外界关注着。在汉传佛教的两千多年里,历朝历代都对《大藏经》进行翻译、增补、修订,为了使人们阅读古文典籍更加便捷,同时提高学者的工作效率,龙泉寺在整理和校勘的《大藏经》时,运用了包括深度学习、OCR、NLP在内的现代技术来改变传统《大藏经》的解读方式。例            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-08 23:14:37
                            
                                101阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            文本匹配和语义匹配1、什么是文本匹配?文本匹配是自然语言处理中一个重要的基础问题,可以应用于大量的NLP任务中,如信息检索、问答系统、复述问题、对话系统、机器翻译等,这些NLP任务在很大程度上可以抽象为文本匹配问题。例如网页搜索可抽象为网页同用户搜索Query的一个相关性匹配问题,自动问答可抽象为候选答案与问题的满足度匹配问题,文本去重可以抽象为文本与文本的相似度匹配问题。2、文本匹配方法概述2-            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-27 21:28:26
                            
                                136阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            参考书目:python自然语言处理实战——核心技术与算法TF/IDF基本思想:TF是计算一个词在一篇文档中出现的频率,IDF是一个词在多少篇文档中出现过,显然TF越高证明这个词在这篇文章中的代表性就越强,而INF越低则证明这个词在具有越强的区分能力。因此中和这两个数,就能较好地算出文档的关键词。关键公式|D_i|是文档中出现词i的文档数量,|D|是文档数附上书上抄来的代码import jieba
            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-27 16:37:27
                            
                                95阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            全球计算机视觉三大顶级会议之一 CVPR 2019 将于当地时间 6 月 16-20 日在美国洛杉矶举办。届时,旷视首席科学家、研究院院长孙剑博士将带领团队远赴盛会,助力计算机视觉技术的交流与落地。在此之前,旷视每周会介绍一篇被 CVPR 2019 接收的论文,本文是第 5 篇,旷视南京研究院提出了一种基于图卷积网络的多标签识别模型 ML-GCN 以及一种构建相关系数矩阵的二次加权方法。             
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-18 09:28:57
                            
                                89阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、什么是命名实体识别命名实体识别是识别一个句子中有特定意义的实体并将其区分为人名,机构名,日期,地名,时间等类别的工作。命名实体识别本质上是一个模式识别任务, 即给定一个句子, 识别句子中实体的边界和实体的类型。是自然语言处理任务中一项重要且基础性的工作。二、实体关系抽取实体和实体之间存在着语义关系, 当两个实体出现在同一个句子里时, 上下文环境就决定了两个实体间的语义关系。完整的实体关系包括两            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-08 12:40:19
                            
                                86阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            意念打字登Nature封面!每分钟写90个字符,准确率超99%,网友:我打的都比它慢万万没想到,脑机接口这么快就有了重大突破!甚至还登上了Nature封面。一位截瘫患者,正在用“意念”打出一段话,0.5秒左右就能输出一个字母。准确率也十分惊人,高达99.1%。RNN立功了这位代号为T5的老爷子脑中植入的,是两个来自Braingate的电极阵列,各含有96个电极。实验刚开始就遇到第一个困难:如何识别            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-21 18:41:03
                            
                                14阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            语言识别的概念机器翻译用印刷文本作为输入,能清楚地区分单个单词和单词串 。 语音识别用语音作为输入,口语对话与语音信号中语言提取的不同: (1)上下文猜测 (2)肢体语言传达信息 fare | fair male | mail语音识别的主要过程语音识别流程分帧:把一段语音分成若干小段 状态:把每一帧识别作为一个状态 音素:把状态组合成音素,即声母亲和韵母。 声学模型(acoustic model)            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-21 11:58:49
                            
                                78阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            模式识别是什么?作为人工智能的一个重要方向,模式识别的主要任务是模拟人的感知能力,如通过视觉和听觉信息去识别理解环境,又被称为“机器感知”或“智能感知”。人们在观察事物或现象的时候,常常要寻找它与其他事物或现象的不同之处,并根据一定目的把相似、但又细节不同的事物或现象组成一类。字符识别就是一个典型的例子,如数字“4”可以有各种写法,但都属于同一类别。人脑具有很强的模式识别和推广能力,即使对于某种不            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-05 19:31:05
                            
                                84阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            摘要 本文介绍基于NLP领域多方式融合方法进行关于图文方面的内容理解和应用。一、简介图文内容标签有三个典型的应用场景[1]:第一,个性化推荐,通过对内容进行标签提取,结合用户的兴趣TAG,对用户进行精准的个性化推荐,是内容标签在个性化推荐上面的一个典型的应用。第二,搜索,通过内容的关键词或者内容标签,跟用户输入的关键词做精准匹配,返回更精确的搜索结果。第三,标签提取,使用内容标签作为            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-20 21:28:08
                            
                                59阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            pytorch进行图像识别 Facebook已将其PyText项目开源,该项目是一种用于自然语言处理(NLP)的机器学习库,旨在使实验项目和生产系统的组合变得更加容易。  PyText建立在Facebook现有的PyTorch库中,用于机器学习,并由公司内部使用,其创建目的是解决如何使用神经网络(例如用于NLP)进行机器学习。 他们在帖子中说,这样的库通常是“在针对实验优化的框架和针对生产优化的框            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-04 21:35:31
                            
                                57阅读