NLP博客_原创博文第46页

hanLP聚类算法

论文题目：聚类算法研究论文来源：聚类算法研究翻译人：BDML@CQUT实验室聚类算法研究孙吉贵 , 刘杰 , 赵连宇Clustering Algorithms ResearchSUN Ji-Gui, LIU Jie, ZHAO Lian-Yu摘要对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括;另一方面

hanLP聚类算法

聚类

聚类算法

ide

编程思想者

6月前

24阅读

本文为土耳其中东技术大学（作者：ENES YUNC ¨ U¨）的硕士论文，共86页。随着计算技术的出现，人机交互已经超越了简单的逻辑计算。情感计算的目的是在心理水平上改善人机交互，使计算机能够根据人类的需要调整自己的反应。因此，情感计算的目的是通过捕捉来自人类的视觉、听觉、触觉和其他生物特征信号的线索来识别情感。情绪在调节人类与外界的体验和互动中起着至关重要的作用，对人类的决策过程有着巨大的影响。

离线语音识别效果示例

sed

ci

人机交互

jowvid

6月前

24阅读

医院挂号NLP模型医院挂号nlp模型图片

背景现在关于NLP的实在是太火了，各种神奇的模型，比如chatgpt，SD等。现在大模型、预训练模型非常火爆。其实现在的nlp技术门槛，已经非常低了，基本上你只要熟练掌握python和transfromers库的用法就行了。我们上一期就是介绍的transformers库，然后里面有个文本分类的任务，有的读者竟然还去尝试了一下，然后发现代码没跑通（确实是我代码问题）。其实分类这个任务，在现实生活中，

医院挂号NLP模型

自然语言处理

分类

人工智能

数据

mob64ca14147fe3

6月前

15阅读

bert词嵌入量化

在工程应用中使用Bert来进行对下游任务的处理过程中，一开始采用Bert-as-service这个服务，但是在实际应用中发现即使采用这个开源的服务资源，仍然对机器的性能有一定的要求，在没有GPU显卡的机器上运行经常会出现并发问题。在1080ti的机器上运行调用一次服务大概花费的时候一秒左右。这样对于在线需要实时率的应用来说仍然达不到使用标准，当然离线应用的话可以当我没说过。对于上面的问题我目前的解

bert词嵌入量化

自然语言处理

tensorflow

深度学习

解决方案

mob64ca140b0bc8

6月前

20阅读

NLP 计算向量数组的距离

1. 概述在学习机器学习(machine learning)或模式识别(pattern recognition)过程中，我经常会困惑于向量、数组和矩阵这三种数据结构，而在学习张学工教授《模式识别》一书时，我又碰到了二维矩阵这个对我很模糊的概念，一生气就自己总结一个吧。2. 数组、向量、矩阵和向量空间2.1 数组[转载自：]概念：所谓数组，是有序的元素序列。这里的概念就没有涉及到空间了

NLP 计算向量数组的距离

线性代数

向量空间

二维

数组

编程艺术之光

6月前

11阅读

NLP位置感知 nlp感受

作者：陈琰钰，清华大学，Datawhale成员越来越多的人选择参加算法赛事，为了提升项目实践能力，同时也希望能拿到好的成绩增加履历的丰富度。期望如此美好，现实却是：看完赛题，一点思路都木有。那么，当我们拿到一个算法赛题后，如何破题，如何找到可能的解题思路呢。本文针对NLP项目给出了4种常见的解题思路，其中包含1种基于机器学习的思路和3种基于深度学习的思路。一、数据及背景https://tianch

NLP位置感知

算法

机器学习

人工智能

深度学习

mob64ca140f29e5

6月前

28阅读

预训练语言模型实现机器翻译

2019年3月，百度正式发布NLP模型ERNIE，其在中文任务中全面超越BERT一度引发业界广泛关注和探讨。经过短短几个月时间，百度ERNIE再升级，发布持续学习的语义理解框架ERNIE 2.0，及基于此框架的ERNIE 2.0预训练模型。继1.0后，ERNIE英文任务方面取得全新突破，在共计16个中英文任务上超越了BERT和XLNet, 取得了SOTA效果。本篇内容可以说是史上最强实操课程，由浅

预训练语言模型实现机器翻译

数据

git

数据处理

蓝梦之翼

6月前

31阅读

paddlenlp 分类schema paddle视频分类

全文5352字，预计阅读时间14分钟随着短视频的快速发展以及安全管理的需求不断增多，视频领域的相关技术应用包括视频智能标签、智能教练、智能剪辑、智能安全管理、文本视频检索、视频精彩片段提取、视频智能封面正逐渐成为人们生活中的重要部分。以视频相关业务为例，短视频网站希望能迅速给每个新作品打上标签并推送给合适的用户，剪辑人员希望从比赛视频中便捷地提取精彩比赛片段集锦，教练员希望系统分析运动员的动作并进

paddlenlp 分类schema

算法

人工智能

百度

模态

技术领航博主

6月前

12阅读

nlp语料标注码表管理 nlp文本数据标注

随着技术的进步，人工智能技术作为”新基建”提速的重要一环，应用场景已经日趋广泛，比如在传媒领域的智能机器人写作、各类APP的个性化内容推荐以及准确度接近人类的实时翻译工具等。各行业越来越多的应用案例证明，利用AI技术来提高企业的业务效率，是智能经济时代企业降本增效、提升核心竞争力的必备“秘籍”。EasyDL是基于飞桨深度学习平台推出的面向企业打造的零门槛AI开发平台。EasyDL发布以来，在工业、

nlp语料标注码表管理

人工智能

数据

开发者

数据集

勇往直前的巨人

6月前

68阅读

中文nlp常用的预处理

一、为什么要进行预训练？深度学习时代，为了充分训练深层模型参数并防止过拟合，通常需要更多标注数据喂养。在NLP领域，标注数据更是一个昂贵资源。PTMs从大量无标注数据中进行预训练使许多NLP任务获得显著的性能提升。总的来看，预训练模型PTMs的优势包括：在庞大的无标注数据上进行预训练可以获取更通用的语言表示，并有利于下游任务；为模型提供了一个更好的初始化参数，在目标任务上具备更好的泛化性能、并加速

中文nlp常用的预处理

自然语言处理

人工智能

深度学习

语言模型

mob64ca1412ee79

6月前

47阅读

机器翻译测试集

课程简介 “手把手带你学NLP”是基于飞桨PaddleNLP的系列实战项目。本系列由百度多位资深工程师精心打造，提供了从词向量、预训练语言模型，到信息抽取、情感分析、文本问答、结构化数据问答、文本翻译、机器同传、对话系统等实践项目的全流程讲解，旨在帮助开发者更全面清晰地掌握百度飞桨框架在NLP领域的用法，并能够举一反三、灵活使用飞桨框架和PaddleNLP进行NLP深度学习实践。背景

机器翻译测试集

飞桨

深度学习

人工智能

自然语言处理

mob64ca13fe9c58

6月前

37阅读

paddleNLP 底层是ERNIE paddledetection

【飞桨开发者说】侯继旭，海南师范大学本三自动化专业在读，人工智能开发爱好者，曾获2019中国高校计算机大赛-人工智能创意赛海南省一等奖、2019年度海南省高等学校科学研究“人工智能”优秀成果奖本项目以ssd_mobilenet_v1_voc算法为例，详细介绍了从准备数据集、到模型训练，并将模型部署到树莓派的全过程。缺训练数据的痛苦，相信做过模型训练的小伙伴们都深有感触。为了便于大家实战

paddleNLP 底层是ERNIE

人工智能

python

深度学习

tensorflow

幸福的地图

6月前

29阅读

nlp一般投什么期刊 nlp 推荐

近年来，预训练语言模型已逐渐成为NLP任务的主流解决方案。但是在业务场景中，往往会遇到标注数据不足的问题，如何利用少量样本将模型快速迭代至可用状态成为了必要的研究方向。近期，PaddleNLP团队开源了AutoPrompt方案，基于开源的文心ERNIE预训练语言模型，结合了领域预训练和自动化提示学习技术，以291M参数量的模型在小样本权威学习榜单FewCLUE排名第一。FewCLUE榜单排名（截

nlp一般投什么期刊

数据

数据集

语言模型

mob64ca1417eedd

6月前

24阅读

自监督模型在Nlp领域应用自我监督软件

最近一直在找一款个人任务管理，并且可以进行任务完成情况实时监控统计的软件，但试了又试，一直没找到满意的，无意间在B站发现了别人用 Notion 做的仪表盘，很是满意心动，所以就打算先仿照着也弄一个。废话不多说，直接开始吧！先放几张完成后的效果图：实现对一次性、循环、长期任务进行管理和监控，目前自己也刚把雏形搭建好，后续可以进行更多的个性化设计，我真的太喜欢这种高度自由度设计的软件了！一、登录账号

自监督模型在Nlp领域应用

效率提升

Notion

任务管理

客户端

mob64ca1415bcee

6月前

24阅读

NLP场景迭代速度快 nlp落地场景

NLP落地场景的探讨相比推荐系统这个工业场景味道比较浓的名词，NLP可能显得更加学术，主要是因为NLP本身更像是一个工具的角色，他解决的就是人类语言相关的问题，推荐系统则是一个完整地系统，根据实际需求往里面塞东西。那么换个视角，现在我们常说，为互联网创造更多钞票的，应该是搜广推三大领域，即搜索、广告、推荐。NLP在搜索中起到的作用还是比较关键的，毕竟没有语言的话用户的query理解不了，一些物料和

NLP场景迭代速度快

大数据

编程语言

python

机器学习

mob64ca14193248

6月前

17阅读

nlp 提高数据质量 nlp数据增强

与计算机视觉中使用图像进行数据增强不同，NLP中文本数据增强是非常罕见的。这是因为图像的一些简单操作，如将图像旋转或将其转换为灰度，并不会改变其语义。语义不变变换的存在使增强成为计算机视觉研究中的一个重要工具。我很好奇是否有人尝试开发NLP的增强技术，并研究了现有的文献。在这篇文章中，我将分享我对当前用于增加文本数据的方法的发现。方法 1. 词汇替换这种方法试图在

nlp 提高数据质量

数据

github

数据库

mob64ca14144dde

6月前

23阅读

ai语音识别模块怎么与电机连接

亲爱的读者朋友们，3月，百度智能云的AI技术又有上新和优化啦。在新增AI技术方面，我们在语音技术、人脸与人体识别、语言处理基础技术、文字识别等方面都有上新。在AI技术模型优化方面，我们提升了文字识别和图像审核的准确率和易用性，让企业以最简单、最便利的方式享受到AI。让我们详细看一下吧。新开放AI技术能力我们按照技术分类来梳理。语音技术：又快又准这一次重点推出了语音识别极速版，速度更快，适用范围更广

ai语音识别模块怎么与电机连接

文字识别

百度

语音识别

网络安全守卫

6月前

17阅读

国内大语言模型有哪些

语言模型是自然语言处理（NLP）中的一种模型，用于预测一个给定上下文中下一个词或字符的概率分布。它是一个统计模型，通过学习大量文本数据中的语言规律和模式，来对语言的结构和概率进行建模。语言模型的作用有以下几个方面：生成文本：语言模型可以用于生成新的文本，即在给定一段初始文本的情况下，模型能够自动预测下一个最可能出现的词或字符。这对于自动文本生成、机器翻译、对话系统等任务非常有用。文本评

国内大语言模型有哪些

自然语言处理

机器学习

人工智能

语言模型

数据狂徒

6月前

33阅读

自然语言处理情感打分中文库

1 前言隐马尔科夫模型（Hidden Markov Model，以下简称 HMM）是比较经典的机器学习模型了，它在语音识别，自然语言处理，模式识别等领域得到广泛的应用。隐马尔科夫模型继承了马尔科夫链的性质，即马尔科夫性。关于马尔科夫性的介绍，可以参考：随风：自然语言处理（2）主题模型 LDA （第 5 节的 5.2 马尔科夫链（Markov Chain）。2如

自然语言处理情感打分中文库

hmm 求隐藏序列

最短路径

词性

状态转移

mob64ca13ffd0f1

6月前

32阅读

nlp中的cnn的原理图

1.基本概念1.1定义、假设和应用我们先通过一个简单的例子，来了解隐马尔科夫模型HMM。假设：（1）小明所在城市的天气有{晴天，阴天，雨天}三种情况，小明每天的活动有{宅，打球}两种选项。（2）作为小明的朋友，我们只知道他每天参与了什么活动，而不知道他所在城市的天气是什么样的。（3）这个城市每天的天气情况，会和前一天的天气情况有点关系。譬如说，如果前一天是晴天，那么后一天是晴天的概率

nlp中的cnn的原理图

hmm 求隐藏序列

状态转移

维特比算法

数据

mob64ca1407216b

6月前

17阅读

GPUStack v0.6超重磅更新：vLLM多机分布式、昇腾MindIE、模型兼容性检测、模型故障自动恢复，上百项增强打造最好用的模型推理平台

打造业界最好用的模型推理平台。

大模型

模型推理

人工智能

GPU集群

生成式AI

原创

GPUStack

6月前

242阅读

yyds干货盘点

GPUStack v0.6超重磅更新：vLLM多机分布式、昇腾MindIE、模型兼容性检测、模型故障自动恢复，上百项增强打造最好用的模型推理平台

客户端打开服务器的jnlp文件

HttpClient三种不同的认证方案: Basic, Digest and NTLM. 这些方案可用于服务器或代理对客户端的认证，简称服务器认证或代理认证。服务器认证　　HttpClient处理服务器认证几乎是透明的，仅需要开发人员提供登录信息(login credentials)。登录信息保存在HttpState类的实例中，可以通过 setCredentials(String realm, C

客户端打开服务器的jnlp文件

服务器

用户名

HTTP

definitely

6月前

19阅读

多模态与自然语言处理

人类学习本质上是多模态 (multi-modal) 的，因为联合利用多种感官有助于我们更好地理解和分析新信息。理所当然地，多模态学习的最新进展即是从这一人类学习过程的有效性中汲取灵感，创建可以利用图像、视频、文本、音频、肢体语言、面部表情和生理信号等各种模态信息来处理和链接信息的模型。自 2021 年以来，我们看到大家对结合视觉和语言模态的模型 (也称为联合视觉语言模型) 的兴趣越来越浓，一个例子

多模态与自然语言处理

模态

数据集

语言模型

mob64ca1408d5ff

6月前

42阅读

自然语言处理基础任务

一、课程介绍斯坦福大学于2012年3月在Coursera启动了在线自然语言处理课程，由NLP领域大牛Dan Jurafsky 和 Chirs Manning教授授课：https://class.coursera.org/nlp/以下是本课程的学习笔记，以课程PPT/PDF为主，其他参考资料为辅，融入个人拓展、注解，抛砖引玉，欢迎大家在“我爱公开课”上一起探讨学习。课件汇总下载地址：斯坦福大学自然语

自然语言处理基础任务

正则表达式

自然语言处理

最大匹配

lgmyxbjfu

6月前

21阅读

NLP识别文本中的姓名和手机号码

有个项目要用到文字识别，网上找了很多资料，效果不是很好，偶然的机会，接触到百度大脑。百度大脑提供了很多解决方案，其中一个就是文字识别，百度提供了三种文字识别，分别是银行卡识别、身份证识别和通用文字识别，下面我们来测试下吧。第一步：下载PHP文字识别demo 下载地址：第二步：申请api 到百度大脑https://ai.baidu.com/tech/ocr/general申请api &nbsp

NLP识别文本中的姓名和手机号码

文字识别

百度

银行卡识别

mob64ca1412b28c

6月前

40阅读

uniapp 微信小程序语音识别转换数字和英文

文章目录前言一、声音的播放二、使用TTS生成音频文件1.申请百度智能云账号2.创建语音技术应用3.文本转语音文件代码前言上篇文章实现卡片的浏览学习功能，我们已经实现了声音播放。但是这些朗读词语的声音mp3文件是怎么生成，我们是否可以用自动化的方式来生成？一、声音的播放在小程序中，使用下面代码实现声音播放：const innerAudioContext = wx.createInnerAudioC

小程序

阿里云

c#

sqlserver

tts

mob64ca140e4022

6月前

126阅读

聊天机器人 API接口

百度API接口+图灵机器人=语音助手制作流程技术百度API准备图灵机器人注册功能环境准备导入模块完整代码运行结果制作过程的问题及解决办法参考链接制作流程技术Python人工智能语音识别爬虫GUI界面设计百度API准备去官网申请一个百度API，可以参考链接: .图灵机器人注册注册图灵机器人现在有免费、标准、专业、叠加包四个版本，下面介绍各个版本：免费版：免费版适用于个人或测试使用，图灵机器人平台

聊天机器人 API接口

pycharm

语音识别

API

json

mob64ca13f87273

6月前

54阅读

paddlenlp arm 平台

1 引脚控制 PINSEL0-0xE002C000-0x00000000(复位时默认为GPIO)；PINSEL1-0xE002C004-0x15400000(复位时，P0.27-30为AIN0-3)；PINSEL2-0xE002C014复位时地址线引脚功能的选择由BOOT[1:0]决定；P2.31为AIN5;P2.30为AIN4;P3.28为AIN7；P3.29为AIN6；不使能CS1

paddlenlp arm 平台

寄存器

引脚

服务程序

bingfeng

6月前

21阅读

apache opennlp 句法分析 openmp语法

简单来说，由于现在电脑CPU一般都有两个核，4核与8核的CPU也逐渐走入了寻常百姓家，传统的单线程编程方式难以发挥多核CPU的强大功能，于是多核编程应运而生。按照我的理解，多核编程可以认为是对多线程编程做了一定程度的抽象，提供一些简单的API，使得用户不必花费太多精力来了解多线程的底层知识，从而提高编程效率。这两天关注的多核编程的工具包括openMP和TBB。按照目前网上的讨论，TBB风头要盖过

apache opennlp 句法分析

#include

#pragma

i++

mob64ca141a683a

6月前

41阅读

大语言模型token 大语言模型的prompt

目录1 摘要 2 基础prompt方法1.1 Zero-shot1.2 Few-shot3 Instruct Prompt4 一些高级的Prompt 用法4.1 Self-Consistent Sampling温度（Temperature）Top_K4.2 Chain of Thought4.3 Tree of Thought5 自动prompt 设计6

大语言模型token

人工智能

prompt

语言模型

解决方案

码海探险家

6月前

77阅读