#文件操作的几种模式
# r,w,a三种模式操作时,需要指定文件的操作模式为utf-8,否则读取的内容会是乱码
#1、r模式:以字符串的方式读取文件中的数据  【默认模式,文件必须存在,不存在则抛出异常】
#2、w模式:以字符串的方式向文件中写入数据,如果文件中本来有数据,写入数据时会清空原来的数据,写入数据时如果没有该文件会新建文件,
#然后再写入数据  【不可读;不存在则创建;存在则清空内容】            
                
         
            
            
            
            NLP简介NLP相关知识的构成基本术语分词(segment)词性标注 (part-of-speech tagging)命名实体识别(NER, Nemed Entity Recognition)句法分析(syntax parsing)指代消解(anaphora resolution)情感识别(emotion recognition)纠错(correction)问答系统(QA System) NLP            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-08 17:35:31
                            
                                244阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            词性标注(POS-Tagging)这里的例子主要针对英文,词性标注的作用便是给输入的句子的每个单词分割开然后去除功能词,再给每一个单词标注他们的词性,词性有八个主要组成部分:名词、代词、形容词、动词、副词、介词、连词和感叹词。例子:Noun (N)- Daniel, London, table, dog, teacher, pen, city, happiness, hopeVerb (V)- g            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-02 17:24:39
                            
                                208阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、NLP的研究任务机器翻译;情感分析;智能问答;文摘生成;文本分类:采集各种文章,进行主题分析,从而进行自动分类;舆论分析;知识图谱:知识点相互连接而成的语义网络。二、基本术语分词;词性标注:对动词、名词、形容词等进行词性标注。eg:我/r 爱/v 北京/ns 天安门/ns;命名实体识别:从文本中识别具有特定类别的实体(通常是名词),eg:人名、地名、机构名、专有名词(针对技术知识图谱的话,应该            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-03 13:24:46
                            
                                116阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            关于词性标记动词,形容词(4种):VA,VC,VE,VV1、谓词性形容词:VA谓词性形容词大致上相当于英语中的形容词和中文语法中、文学作品里的静态动词。我们的谓词性形容词包括两类:第一类:没有宾语且能被“很”修饰的谓语。第二类:源自第一类的、通过重叠(如红彤彤)或者通过名词加形容词模式意味着“像N一样A”(如雪白)的谓语。这个类型的谓词性形容词没有宾语,但是有一些不能被“很”修饰,因为这些词的强调            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-08 20:48:55
                            
                                305阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            0 词性 & 词性标注词性(pos, part-of-speech)是词汇基本的语法属性,常见的词性有名词、动词、形容词、副词等。词性标注(pos tagging),是指为句子当中的每一个单词标注一个词性,即确定每个单词是名词、动词、形容词或者其他词性的过程。词性标注是很多NLP任务(如句法分析)的预处理步骤,经过词性标注后的文本会给后续任务带来极大的便利性。1 案例说明1.            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-02 22:02:24
                            
                                124阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            英语语法框架10种词性注意:很多单词有很多个词性,会在不同情况下使用不同词性noun(名词)词性缩写:n.verb(动词)词性缩写:v.adjective(形容词)词性缩写:adj.
   常见的形容词:good、fast、hot 
 adverb(副词)词性缩写:adv.
   常见的副词:next、much、back 
 pronoun(代词)词性缩写:pron.
   常见的代词:we、th            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-01 21:00:42
                            
                                99阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            help有帮助; 有助于, 有利于的意思,下面小编为大家详细介绍下help的用法说明,希望对大家有用。help的用法说明如下:1. help sb. to do sth.  帮助某人做某事。Can you help me to learn English ?   你能帮助我吗?I can't help you to lift this stone.  我不能帮你搬这块石头。2. be of som            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-15 21:03:12
                            
                                96阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            NLP一些常见的专有名词(持续跟新中……)词性是词语在句子中扮演的语法角色,也被称为词类(Part-Of-Speech,POS)词性标注(POS Taging)任务是给定一个句子,输出句子中每个词相应的词性。句法分析(Syntactic Parsing)的主要目标是给定一个句子,分子句子的句法成分信息,例如主谓宾定状补等成分。最终的目标是将词序列表示的句子转换成树状结构,从而有助于更准确地理解句子            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-02 22:22:10
                            
                                69阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            怎么区分框架与架构?1、架构是一种抽象,框架是一种具体的实现。架构(动词)是框架(名词)的指导。2、框架是指以具体的软件实现某种或多种特定功能需求(强调先通用在专用,项目里边都会对第三方框架做二次封装)。架构是思想(强调先大局在局部)。3、框架是抽象的解决方案(关注大局忽略细节的实现,因为还强调通用性所以多是半成品)4、两者都是为解决软件开发越来越复杂而采取的策略手段。            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-12 16:44:57
                            
                                7阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            基本概念分/切词(Tokenization)基于词典的分词方法(最大匹配法、最短路径法、最大概率法),实际用的比较多的如下:基于条件随机场(CRF)的中文分词算法的开源系统。基于张华平NShort的中文分词算法的开源系统(结巴分词核心算法)。词性标注(POS Tagging)词性,也称为词类,是词汇的语法属性,是连接词汇到句法的桥梁。 词性标注(Part-of-Speech Tagging或POS            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-05 13:39:32
                            
                                109阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Hierarchical Attention Networks for Document Classification 论文的理解在论文的摘要中,它提出了论文的两个特点。第一个就是对应文章所有具有的分层结构,这个模型采取了相应的分层结构。这个文章的分层结构怎么理解呢?
文章是具有分层结构的,单词构成了句子,句子构成了文章。根据这个结构,HAN提出了在表示文章的时候,先是在第一层得到句子的表示,然后            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-14 21:26:50
                            
                                67阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1、基本术语: (1)分词 分词常用手段:基于字典的最长串匹配,但歧义分词很难。比如:美国/会/通过法案。美/国会/通过法案。 (2)词性标注 词性:动词、名词、形容词等 目的:表征词的一种隐藏状态,隐藏状态构成的转移就构成了状态转移序列。比如:我/r爱/v中国/ns。其中,ns代表名词,v是动词,ns,v都是标注。 (3)命名实体识别 指从文本中识别具有特定类别的实体(通常是名词),例如人名、地            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-20 09:18:02
                            
                                76阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # Python中的帮助功能及其实现
在数据科学和编程的世界中,了解工具和库的功能是至关重要的。在R编程语言中,我们可以通过`help()`函数方便地获取函数或对象的使用说明。而在Python中,尽管没有完全相同的函数,但是我们可以使用多种方法来获取帮助信息。本文将介绍Python中的帮助功能、如何使用它,并提供一些代码示例,帮助读者更好地理解这一概念。最后,我们将绘制一个序列图来说明这一流程。            
                
         
            
            
            
            文章目录文件读取模式实操一,判断文件是否可读,并读取40位。二,逐行读取文件三,写入字符串四,使用with来避免错误的发生五,a+和w+模式的读取 文件读取模式常用模式权限:模式rr+ww+aa+读++++写+++++创建++++覆盖+++追加++这部分我还是有一些疑问,比如:w+和rw有什么区别?        答:没有rw            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-07 13:36:04
                            
                                264阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            其实r 是只读,只能读不能写,这是很明确的,但是r+是可读写,变成r+后还没太明白到底加了什么,还是照样写不了,有没有这样的体验呢,如下代码,只读时f = open("test.txt", 'r', encoding="utf-8") # 文件句柄
f.write("we are heros\n")
data = f.read()
print(data, type(data))
f.close()            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-07 13:07:43
                            
                                69阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            词性标注概述▶ 词类同一个词类的词具有相同的语法功能、在同样的位置中出现划分词类的目的在于描写语句的结构规则,以基于模式自动处理成批的语料(便于自然语言处理)词类 = 实词(content) + 虚词(function)实词——动词、形容词、代词、量词、数词虚词——连词、助词、语气词▶ 词性词性是对具体的词,根据其语法,兼顾其意义,将其归类的结果▶ 词性标注词性标注( POS tagging)就是            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-18 21:38:34
                            
                                79阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            ## Python中`rfind`的`r`是什么?
在Python编程语言中,`rfind`是字符串对象的一个方法,用于查找特定子串在字符串中最后一次出现的位置。`r`代表“right”,意指从右侧进行搜索。这种方法在需要倒序查找字符或子串的场景下特别有用。
### `rfind`的基本用法
`rfind`方法的基本语法如下:
```python
str.rfind(sub[, start            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-10-21 04:41:36
                            
                                145阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            可修改性、可测试性、可扩展性、性能、可用性、可维护性、安全性、可部署性、共享性。      一、可修改性  什么是可修改性?可修改性是指一个系统进行修改的容易程度,以及系统适应这些修改的灵活性。  与可修改性相关的几个方面:可读性(readability)、模块化(modularity)、可重用性(reusability)、可维护性(maintainability)  &nbs            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-12 14:52:04
                            
                                39阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            上周好几天都在搞AES,总算是把Rijndael算法搞明白了。本片会仔细介绍AES(Rijndael算法),后两篇会介绍AES的java和php实现。AES(Rijndael算法)Rijndael算法首先是一个密钥分组加密的算法,通过置换(permutations )和替换(substitutions)迭代加密,进过多轮操作形成密文。AES算是Rijndael算法的一种特殊实现,选的分组为128b