NLP博客_原创博文第78页

hanlp 多音字汉字

将汉字转换成拼音，由于汉字有多音字，所以转换拼音是让人很头疼的一个问题，我想到了一个解决这个问题的办法，就是将每个字的音节都读出来，然后进行拼音重组，这样总有一组拼音是正确的，然后在根据全文搜索技术，就能找到想要的记录了，本人不才自己写了个方法，贴出了，跟大家分享一下，希望多批评指正！！using System; using System.Collections.Generic; using Sy

hanlp 多音字汉字

System

List

字符串

棉花糖

6月前

32阅读

ai nlp 用户意图

基于预训练模型ERNIE 3.0 和CrossWOZ数据的意图识别分类任务AI Studio平台默认安装了Paddle和PaddleNLP，并定期更新版本。如需手动更新Paddle，可参考飞桨安装说明，安装相应环境下最新版飞桨框架。使用如下命令确保安装最新版PaddleNLP：# 首次更新完以后，重启后方能生效 !pip install --upgrade paddlenlpLooking in

ai nlp 用户意图

分类

人工智能

深度学习

paddle

mob64ca1410eb61

6月前

401阅读

bertSum中文文本摘要

本次主要复习了bert_sum中的抽取方式提取文本摘要的部分。记录自己现在的收获与遇到的问题。01数据集：数据集是来自一份汽车对话的数据集，其中内容主要是技师和车主的对话内容。然后对这一份数据集合的每一个样本的整体性内容做了文本摘要。我们需要做的是在一份相类似的数据集上，根据技师和车主的主要对话内容，然后结合该样本的其它辅助信息，给出文本摘要的预测。02 数据处理部分，<1>把数据集中

bertSum中文文本摘要

python

人工智能

自然语言处理

深度学习

mob64ca14193248

6月前

42阅读

PaddleNLP 本地搭建后可视化界面怎么启动

PaddleDTX支持通过docker compose一键拉起测试网络。官网给出了环境需求：docker，推荐版本18.03+docker-compose，推荐版本1.26.0+如果使用Mac启动服务，Docker Desktop 至少设置为4GB 运行时内存服务启动和停止1、一键启动脚本在PaddleDTX/scripts目录下，具体启动步骤如下：$ git clone git@github.c

算法

区块链

paddle

线性回归

取值

mob64ca1411e411

6月前

21阅读

snownlp是多会发明的

目录1.朴素贝叶斯原理2.基于的朴素贝叶斯的文本分类的sklearn实现2.1首先基于sklearn的dataset数据集，贴上朴素贝叶斯手写数字识别的历程。2.2sklearn朴素贝贝叶斯文本分类的实现1.朴素贝叶斯原理直接贴上自己的朴素贝叶斯（参考书籍为西瓜书）学习笔记：2.基于的朴素贝叶斯的文本分类的sklearn实现2.1首先基于sklearn的dataset数据集，贴上朴素贝叶斯手写数字

snownlp是多会发明的

NLP

朴素贝叶斯

sklearn

文本分类

数码精灵abc

6月前

19阅读

paddlenlp UIE 抽取英文代码

如果您英语不错，建议您直接查看原文。 RANSAC是“RANdom SAmple Consensus（随机抽样一致）”的缩写。它可以从一组包含“局外点”的观测数据集中，通过迭代方式估计数学模型的参数。它是一种不确定的算法——它有一定的概率得出一个合理的结果；为了提高概率必须提高迭代次数。该算法最早由Fischler和Bolles于1981年提出。 &

数据集

迭代

数据

技术领航员

6月前

26阅读

hanlp 给句子标点符号

　　很多留学生在essay写作中对于标点符号的正确使用可能不是太清楚，今天Meeloun小编给大家整理了一些关于标点符号的正确打开方式，希望可以帮到同学们！　　Colloquialism俗语：　　如果要在写作过程中使用俗语、俚语或者成语等，不要试图通过添加引号以引起读者注意，直接使用即可。　　Exclamations感叹句：　　不要试图通过使用感叹号而增加一个简单陈述句的强调效果，感叹号只能用于真

hanlp 给句子标点符号

感叹号

双引号

边距

架构领航员

6月前

69阅读

windows api 实现语音识别功能

下面我们将对Win电脑的快捷键做一次汇总介绍，有需要的朋友快来收藏吧！快捷键一：一键搜索“Win+Q”是Windows 11的快速搜索键，点击后会打开Windows 11的搜索栏。与之对应的还有一个Win+S，两者功能完全一致。快捷键二：文字配音这是电脑自带的浏览器，若是想要将内容一一读出来，里面有我们所需要的朗读功能，首先，将文件打开，然后点开右上角的三个点，或者使用【Alt+F】的快捷键，之后

职场和发展

快捷键

Windows

Game

数据小筑

6月前

79阅读

本地端的语言模型

电脑浏览器 EdgeEdge，是微软推出的基于 Chromium 内核的浏览器，用起来和谷歌的 Chrome 浏览器几乎一模一样，而且 Chrome 上已有的插件，换到 Edge 同样可以使用。和 Chrome 一样，Edge 也有一个集合了各种浏览器插件的商店，不需要特殊网络就能访问，这一点可以说是 Edge 浏览器最大的优势，也是许多插件爱好者的福音。Cleanmypc这是一款什么软件呢？看看

本地端的语言模型

chrome

前端

Chrome

输入法

mob64ca13fe62db

6月前

17阅读

问答系统框架设计图

A）：任务型机器人主要用于完成用户的某些特定任务，比如：买机票、话费充值或者天气咨询。B）：闲聊机器人主要用于深入的和用户进行无目的交流；C）：解决型机器人（客服机器人）用于解决用户的问题，比如：商品购买咨询、商品退货咨询等。这里通过一些案例分析来介绍不同情况的算法选型：任务型问题 1）：“成都今天天气怎么样”；2）：“明天呢"；3）：“后天呢”。Sl

问答系统框架设计图

问答系统

EQ

iphone

话不是这么说的

6月前

64阅读

网页添加语音识别

在我们日常生活中，阅读是必不可少的一部分，但是有时候我们可能会碰到一些阅读困难。比如说，我们想看一篇文章，但是因为环境嘈杂，或者手上有其他事情要做，无法专心地进行阅读。这个时候，网页文字转语音就可以派上用场了，它可以将网页上的文字转化成声音。只需要简单的操作，就可以让我们将一篇文章变成一段语音，方便我们随时随地地听取。那么大家知道网页文字转语音软件有哪些吗？一起来探索下吧！软件一：配音工厂软件端口

网页添加语音识别

经验分享

文字转语音

网页内容

办公软件

编程小达人

6月前

32阅读

stm 32 语音识别模块

0.概述ros和stm32等嵌入式单片机的最大区别在于ros主要用于处理slam、机器视觉、人工智能这种对于算力要求高，算法复杂的问题；而stm32和arduino等主要用来处理一些边缘事件，比如亮个LED，驱动个电机啥的。相比于ros，实时性强是嵌入式单片机最大的优点（以我做的两轮平衡小车为例，stm32f103的一个周期大概为3ms左右），所以ros和单片机的通讯是必然的。这篇文章是基于ro

stm 32 语音识别模块

串口

#include

Data

mob64ca1408d5ff

6月前

61阅读

聊天机器人毕设功能介绍

我一直坚信着，即使一个最简单的APP，也有他的难点，如果一个复杂的APP你无法做出来，那肯定是你基础不扎实，我身边的人总是问我，安卓为什么学了有忘记了，总是学不好，有些东西记不住，其实这不能怪你，如果别人开发了那么久的东西，你一下子就学会了，你让谷歌怎么活。篇幅有限，如果读者看不懂的话，可以复习下基础，我尽量将代码简单化了。先看效果图如果你是初学安卓，这个APP你可能要半小时如果

聊天机器人毕设功能介绍

android

java

xml

码海舵手

6月前

44阅读

HanLP 根据一段话生成标题

做自媒体的心里应该都会明白一篇文章或者是一个视频中标题的重要性，当然取一个好的标题也是有点难度的，但是不必担心，也会有一定的取标题的技巧，下面小编就跟大家讲讲一些取标题的建议。1、内容拟定好标题在创作标题的时候还是要以文章的具体内容进行创作，不能盲目地套用标题，也就是不能做标题党，关键要在自己的创作中找到合适的要点，就能取好自己文章的标题，根据内容拟定标题是对你这篇文章的一种升华，如果实在把握补助

HanLP 根据一段话生成标题

百度

热点

新媒体运营

自媒体

detailtoo

6月前

35阅读

完全开源生成语言模型

为什么编程语言都是开源的在最简单的层次上，开源编程仅是编写其他人可以自由使用和修改的代码。但是您听说过玩Go的老栗子，对吗？ “如此简单，只需花一分钟就可以学习规则，但如此复杂，则需要终生掌握。” 编写开源代码是一种非常相似的经历。在GitHub，Bitbucket，SourceForge或您自己的博客或网站上插入几行代码很容易。但是，正确地进行操作需要一些个人的投入，精力和前瞻性。

完全开源生成语言模型

编程语言

python

java

人工智能

mob64ca13f937ae

6月前

33阅读

hanlp 过滤数字

在处理自然语言处理任务时，尤其是中文文本分析，使用HanLP工具库进行数据处理时，常常会遇到如何过滤数字的问题。本文将详细记录这个过程，包括环境预检、部署架构、安装过程、依赖管理、扩展部署和迁移指南。 ## 环境预检对于使用HanLP的环境要求如下： | 组件 | 版本 | |--------------|----------| | Python | 3

ci

bash

python

原创

mob649e815d65e6

6月前

47阅读

hanlp怎么使用停用词

在自然语言处理（NLP）领域，使用停用词（stop words）是进行文本分析和数据处理的一个常见任务。停用词是指在文本处理中被认为没有重要意义的词汇，如“的”、“了”、“在”等。如何在 HanLP 中使用停用词，是许多开发者和数据科学家的一个重要问题。 ```mermaid flowchart TD A[启动文本分析] --> B{是否加载停用词?} B -- 是 --> C[

加载

文本分析

文本处理

原创

mob649e8166c3a5

6月前

64阅读

hanlp中文词性标签

hanlp中文词性标签提供了一种高效的中文分词与词性标注解决方案，支持多种应用场景的文本分析。本文将详细记录我在解决“hanlp中文词性标签”问题过程中的步骤和思考，涵盖环境预检、部署架构、安装过程、依赖管理、服务验证和版本管理。 ## 环境预检在开始之前，我需要确认系统的基本要求，以确保能够顺利运行hanlp中文词性标签。以下是系统与硬件配置的详细信息： ### 系统要求 | 操作系统

词性

Server

解决方案

原创

mob64ca12d39d4a

6月前

31阅读

大佬大语言模型科普 ppt 下载

【天极网IT新闻频道】10月19日消息，日前，国际语音识别大牛、前约翰霍普金斯大学(Jonhs Hopkins University)教授、语音识别开源工具Kaldi之父Daniel Povey在Twitter上宣布，他将与小米签订一项工作协议，工作地点位于北京。同时，Jonhs Hopkins还表示自己将于2019年底之前前往北京工作，且会招聘一个小团队打造新一代的“PyTorch-y”Kal

大佬大语言模型科普 ppt 下载

语音识别

开源工具

深度学习

技术领航员

6月前

37阅读

GPT可以做NLP吗

今天凌晨，OpenAI 公布了其大型语言模型的最新版本 ——GPT-4。有多强？根据OpenAI官方的介绍，GPT-4是一个超大的多模态模型，也就是说，它的输入可以是文字（上限2.5万字），还可以是图像。回答准确性显著提高；能够生成歌词、创意文本，实现风格变化。这次GPT-4的发布不仅仅是发布这么简单：ChatGPT Plus：集成GPT-4的ChatGPT升级版发布GPT-4的API公布技术论文

GPT可以做NLP吗

人工智能

模态

服务器

公众号

梦里忧郁

6月前

28阅读

机器翻译 NOIP 2010 提高组

作者 | 马湘楠本文为ACL2022杰出论文【Learning to Generalize to More: Continuous Semantic Augmentation for Neural Machine Translation】的详细解读。该文章由阿里达摩院、中科院信息工程研究所、中国科学院大学联合合作完成，其在机器翻译领域提出了新的数据增强范式，实现了连续语义增强方法，并通过

机器翻译 NOIP 2010 提高组

数据

编码器

机器翻译

梦断蓝桥魂

6月前

29阅读

nlp bert和transformer的关系

论文：https://export.arxiv.org/pdf/1706.03762.pdf 参考资料：(60条消息) Transformer详解（看不懂你来骂我）_mathor的博客-CSDN博客_transformer(60条消息) Transformer代码完全解读！_Datawhale-目录Transformer模型架构Encoder Positional encodi

transformer

深度学习

机器翻译

git

词向量

mob64ca14173efa

6月前

34阅读

NLP训练模型结果

在NLP（自然语言处理）模型的训练过程中，模型结果的评估是关键的一步。如何确保我们的模型能够在实际应用中表现优异是一个复杂的任务。本文将深入探讨解决“NLP训练模型结果”问题的关键步骤，以便为开发人员和研究人员提供有用的指导。 ## 背景定位在我们进行NLP模型训练时，可能会面临多种问题场景，比如模型过拟合、欠拟合或者数据偏倚等。这些问题会直接影响模型的性能，使其在真实世界任务中表现不佳。例

Memory

Data

开发者

原创

mob64ca12e1c36d

6月前

43阅读

PaddleNLP中的Taskflow 的策略设置

在PaddleNLP中，Taskflow是一个极为方便的接口，用于快速构建自然语言处理任务中的工作流。然而，在策略设置方面，有时会遇到一些挑战。本文旨在详细记录这个过程，帮助读者更好地理解和使用PaddleNLP中的Taskflow策略设置。我们将通过业务影响、参数解析、调试步骤、性能调优、排错指南和最佳实践等方面进行深入探讨。对于现代企业而言，逐渐依赖深度学习模型处理海量文本数据，低效的策略

高级技巧

参数配置

最佳实践

原创

mob64ca12f3bbc7

6月前

25阅读

jenkins jnlp 配置

在这篇文章中，我们将探讨如何进行“Jenkins JNLP配置”。Jenkins是一个广受欢迎的开源自动化服务器，JNLP（Java Network Launch Protocol）是一种用于远程连接Jenkins代理的技术。因此，正确配置JNLP非常重要。接下来，我们将通过一系列步骤来详细了解这个过程。 ### 环境准备首先，我们需要确保环境中安装了以下前置依赖： - **Jenkins

Jenkins

jar

java

原创

mob64ca12ef217e

6月前

31阅读

nlp句式转化

在近年来的自然语言处理（NLP）领域，句式转化（Sentence Transformation）技术逐渐成为研究热点。它不仅能提升文本的可读性和多样性，还能帮助实现机器翻译、信息摘要等任务。下面，我将详细记录如何解决“nlp句式转化”问题的全过程，包括环境配置、编译过程、参数调优、定制开发、调试技巧和错误集锦。 ### 环境配置为了实现nlp句式转化，我们首先需要准备合适的开发环境。以下是环

编译过程

开发者

GDB

原创

mob64ca12e91aad

6月前

10阅读

paddlenlp下载慢

在使用 PaddleNLP 进行自然语言处理时，我常遇到一个痛点，就是下载速度实在太慢。为了让我和其他朋友们在这个过程中更高效，我决定整理一下如何解决这个问题的步骤。接下来，我将通过不同的模块来详细讲述这段经历。 ## 环境配置在开始之前，我们需要先配置好环境。以下是我所使用的环境依赖及其版本。 | 依赖包 | 版本 | |--------------|--

下载速度

ci

python

原创

mob64ca12e10b51

6月前

38阅读

rknn 不支持nlp

出现“rknn 不支持nlp”的问题，可以归结为在迁移 NLP 模型时遇到的一系列挑战。本文将详细讨论这一问题的背景、错误现象、根因分析、解决方案、验证测试和预防优化策略。 ## 问题背景随着自然语言处理（NLP）技术的快速发展，我开始将一些传统深度学习模型迁移至 RKNN（Rockchip NN）平台。RKNN 作为一个专业的边缘计算推理框架，原本非常适合处理视觉类模型。但是，在处理 NL

工具链

解决方案

加载

原创

mob64ca12d2dee8

6月前

91阅读

如何在conda中安装hanlp

如何在conda中安装hanlp 由于自然语言处理（NLP）在近几年得到了广泛应用，越来越多的开发者和研究人员希望能够快速而高效地实现相关任务。在这个背景下，HanLP作为一款功能强大的自然语言处理工具，受到了越来越多的关注。HanLP可以在多种平台上进行安装，其中利用Anaconda（conda）包管理工具进行安装是最为简便的方式之一。然而，很多用户在尝试在conda环境中安装HanLP时

User

安装过程

ci

原创

mob64ca12d4650e

6月前

157阅读

CoreNLP解析文章关键字

在现代信息处理技术中，进行有效的信息提取和分析已成为非常重要的研究方向之一。CoreNLP作为一种强大的自然语言处理工具，可以帮助我们从文章中提取关键字，分析回顾内容结构。在这篇文章中，我将详细探讨如何利用CoreNLP解析文章关键字，同时结合协议背景、抓包方法、报文结构、交互过程、性能优化、安全分析等关键方面进行阐述。 ## 协议背景为了更好地理解数据交换和协议的演变过程，我们需要使用四象

HTTP

抓包

字段

原创

mob649e81624618

6月前

64阅读