函数函数基础知识递归函数递归函数的条件例题1:判断回文字符串例题2:汉诺塔问题高阶函数匿名函数闭包闭包形成的条件闭包的特点nonlocal 关键字装饰器一般写法语法糖写法 函数基础知识【Python】函数基础知识递归函数函数的返回值是函数自身用于解决可以拆分的大问题递归函数的条件递归条件:问题可以被继续分解基线条件:问题最小化时返回一个确切的值,并停止递归例题1:判断回文字符串def Palin
转载
2023-12-25 12:31:32
42阅读
前言:从今天开始正式学习自然语言处理,同时还有统计学习方法和机器学习。希望能够一直坚持下去。(以下答案非标准答案,如有错误请积极回复。谢谢理解。)正文在开始之前首先引入nltk和nltk.bookimport nltk
from nltk.book import *○尝试使用Python 解释器作为一个计算器,输入表达式,如12/(4+1)。12/(4+1)output:2.4○26 个字母可以组
转载
2024-01-28 10:26:39
72阅读
1.8 练习1.○尝试使用Python解释器作为一个计算器,输入表达式,如12/(4+1)。2.○26个字母可以组成26的10次方或者26**10个10字母长的字符串。也就是141167095653376L(结尾处的L只是表示这是Python长数字格式)。100个字母长度的字符串可能有多少个?3.○Python乘法运算可应用于链表。当你输入['Monty', 'Python'] 20或者3 s
转载
2023-11-26 13:38:18
51阅读
作者 | Rao,McMahan译者 | Liangchu校对 | gongyouliu编辑 | auroral-L第七章 自然语言处理的进阶序列模型7.1 Vanilla RNN(或Elman RNNs)的问题7.2 门控——Vanilla RNN的挑战的解决方案7.3 示例:用于生成姓氏的字符RNN 7.3.1 SurnamesData
转载
2024-05-17 13:12:17
49阅读
最近读了《Python深度学习》, 是一本好书,很棒,隆重推荐。本书由Keras之父、现任Google人工智能研究员的弗朗索瓦•肖莱(François Chollet)执笔,详尽介绍了用Python和Keras进行深度学习的探索实践,涉及计算机视觉、自然语言处理、生成式模型等应用。书中包含30多个代码示例,步骤讲解详细透彻。由于本书立足于人工智能的可达性和大众化,读者无须具备机器学习相关背景知识即
转载
2023-09-07 11:11:13
50阅读
今天开始对HTML文件的处理,主要根据Python自然语言处理这本书籍。1.实现对本地文件的读取和可视化过程。>>> f=open('try111.txt',encoding='utf-8')
>>> raw=f.read()
>>> print(raw)或者对于需要换行输出的文本(即需要删掉原有的换行符),可以执行如下操作f=open('tr
转载
2024-04-16 11:57:14
48阅读
本章解决的问题:1. 编写程序访问本地和网络上的文件(后的语言材料)2.把文档分割成单独的词和标点符号(加工原料文本)3.编写程序产生格式化的输出,把结果保存在一个文件中 NLP的流程图处理流程:打开一个URL,读里面HTML格式的内容,去除标记,并选择字符的切片,然后分词,是否转换为nltk.Text对象是可选择的。我们也可以将所有词汇小写并提取词汇表。在这条流程后面还有很多操作。要正
转载
2023-08-26 23:31:26
47阅读
NLTK1.语言处理与python1.1python相关用法:nltk.book()text.concordance(‘单词’) 查询文本中的单词text.similar(“单词”)text.generate()len()列表: +进行列表连接 append()追加索引 切片变量字符串频率分布:FreqDist hapaxes()低频词细粒度的选择词:选择出现次数多且长的词语词语搭配和双连词: 使
转载
2024-06-30 21:53:39
41阅读
如果你已经在AI领域入门,并且有一定的理论基础,那么也可以通过这一章节快速对一些基础知识进行复习,方便后面更加高效的学习。接下来我们一起看一下第一章所讲内容。1.1 数学和Python的复习该节主要讲解了神经网络中向量、矩阵等内容。1.1.1 向量和矩阵我们知道向量是同时拥有大小和方向的量。向量可以表示为排成一排的数字集合,在Python实现中可以处理为一维数组。与此相对,矩阵是排成二维形状(长方
转载
2023-12-01 19:35:01
90阅读
1、jieba扩展库(库描述,基本操作)2、文本词频统计实战(《三国演义》词频统计、人物统计)首先我们来了解一下中文分词的特点和难点: 【中文分词介绍】【中文分词特点】词是最小的能够独立活动的有意义的语言成分汉语是以字为单位,不像西方语言,词与词之间没有空格之类的标志指示词的边界分词问题为中文文本处理的基础性工作,分词的好坏对后续中文信息处理起关键作用【中文分词难点】分词规范,词的定义还
转载
2023-09-25 20:33:07
125阅读
目录 第五篇.python进阶1. 异常处理2. 数字类型内置方法2.定义:3.常用操作+内置方法:4.存一个值or多个值:5.有序or无序:6.可变和不可变1.用途:2.定义:3.常用操作+内置方法:4.存一个值or多个值:5.有序or无序:4. 字符串类型内置方法1.用途:2.定义:3.常用操作+内置方法:5. 列表类型的内置方法6. 元组类型的内置方法7. 字典类型的内置方法8. 集合类
转载
2023-09-29 21:05:51
50阅读
特点展示如何使用基于 Python 的深度学习库 PyTorch 应用这些方法演示如何使用 PyTorch 构建应用程序探索计算图和监督学习范式掌握 PyTorch 优化张量操作库的基础知识概述传统的 NLP 概念和方法学习构建神经网络所涉及的基本思想使用嵌入来表示单词、句子、文档和其他特征探索序列预测并生成序列到序列模型学习构建自然语言处理生产系统的设计模式内容介绍
监督学习范式观察和目标
转载
2023-09-05 08:07:21
281阅读
1 找出文件中以ing结尾的文字In [5]: for line in open("regular_express.txt"): for word in line.split(): if word.endswith('ing'): ...: 
转载
2024-06-18 20:29:11
142阅读
注:本文选自人民邮电出版社出版的《PyTorch自然语言处理入门与实战》一书,略有改动。经出版社授权刊登于此。 处理中文与英文的一个显著区别是中文的词之间缺乏明确的分隔符。分词是中文自然语言处理中的一个重要问题,但是分词本身也是困难的,同样面临着自然语言处理的基本问题,如歧义、未识别词等。 本内容主要涉及的知识点有
转载
2024-01-31 21:15:00
288阅读
译者 | Arno【导读】:本文介绍了最先进的自然语言处理库——PyTorch-Transformers。 概览我们在本文中将介绍最新且最先进的的NLP库:PyTorch-Transformers我们还将在Python中使用PyTorch-Transformers实现流行的NLP模型(如谷歌的BERT和OpenAI的GPT-2) !正如我们所知,这有可
转载
2024-05-06 07:43:10
674阅读
中文分词中文分词中有众多分词工具,如结巴、hanlp、盘古分词器、庖丁解牛分词等;其中庖丁解牛分词仅仅支持java,分词是HanLP最基础的功能,HanLP实现了许多种分词算法,每个分词器都支持特定的配置。接下来我将介绍如何配置Hanlp来开启自然语言处理之旅,每个工具包都是一个非常强大的算法集合,所以小编以后将花一些时间去看看里面源码如何。下载jar、property和data文件下载jar文件
转载
2018-12-07 10:06:38
649阅读
自然语言处理是一门融语言学、计算机科学、数学于一体的学科,比较复杂,学习门槛高,但本书巧妙地避开了晦涩难懂的数学公式和证明,即便没有数学基础,也能零基础入门。本书专注于中文的自然语言处理,以Python及其相关框架为工具,以实战为导向,详细讲解了自然语言处理的各种核心技术、方法论和经典算法。三位作者在人工智能、大数据和算法领域有丰富的积累和经验,是阿里巴巴、前明略数据和七牛云的资深专家。同时,本书
转载
2024-04-07 20:33:18
44阅读
全文共2448字,预计学习时长7分钟图源:unsplash 当谈到学习方法时,我们常常会提到教程、博客文章、在线课程等等,书本有时会被忽略了。即使你是在找一本关于某个主题的书,你也会很快发现这样的书太多了,无法快速判断哪一本最适合自己。 为了帮助你解决问题,我帮你选择5本关于自然语言处理的书,不像其他的书单,除了第一本之外,这些书都不是免费的,但事实证明它们是值得投资的,希望能
转载
2023-10-01 16:04:37
104阅读
自然语言处理的库非常多,下面列举一些对Python友好,简单易用,轻量,功能又全的库。1 中文中文自然语言处理工具评测:https://github.com/mylovelybaby/chinese-nlp-toolkit-testawesome: https://github.com/crownpku/Awesome-Chinese-NLPHanlp地址:https://github.
转载
2023-12-11 22:13:06
85阅读
利用计算机将大量的文本进行处理,产生简洁、精炼内容的过程就是文本摘要,人们可通过阅读摘要来把握文本主要内容,这不仅大大节省时间,更提高阅读效率。但人工摘要耗时又耗力,已不能满足日益增长的信息需求,因此借助计算机进行文本处理的自动文摘应运而生。近年来,自动摘要、信息检索、信息过滤、机器识别、等研究已成为了人们关注的热点。自动摘要(Automatic Summarization)的方法主要有两种:Ex
转载
2023-08-09 15:35:07
317阅读