该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。谁和我隔得近,我就跟谁是一类,有点中国古语说的近墨者黑近朱者赤意思。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 KNN方法虽然从原理上也依赖于极限定理,但在类别决策时,只
转载
2023-06-27 10:37:28
156阅读
一、思维导图二、Python源码## 二分类问题 * 使用skleran自带的逻辑回归、支持向量机、决策树API进行二分类的任务 * 使用sklearn的iris数据集,将iris数据集变成一个二分类的数据集,删除类别为2的数据 * 使用准确率对模型进行评价### 准备数据
import pandas as pd
import numpy as np
from sklearn import dat
转载
2024-06-18 15:34:57
29阅读
一、数据集 sklearn.datasetsfrom sklearn.datasets import load_irisiris = load_iris()iris.keys()iris.data.shape # (150,4)iris.target.shape iris.datairis.featurs_names玩具数据集鸢尾花数据集葡萄酒数据集波士顿房价数据集手写数字数据集乳腺癌数据集糖尿
原创
2022-07-01 11:32:27
35阅读
一、NLP是什么自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语
转载
2023-05-24 14:53:53
213阅读
导语:scikit-learn是Python中一个功能非常齐全的机器学习库,本篇文章将介绍如何用scikit-learn来进行kNN分类计算。不费话from sklearn import neighbors开始吧。功能详解本篇中,我们讲解的是 scikit-learn 库中的 neighbors.KNeighborsClassifier,翻译为 k 最近邻分类功能,也就是我们常说的 kNN,k-n
转载
2024-09-03 21:59:21
40阅读
概要在 sklearn 包中,OneHotEncoder 函数非常实用,它可以实现将分类特征的每个元素转化为一个可以用来计算的值。本篇详细讲解该函数的用法,也可以参考官网 sklearn.preprocessing.OneHotEncoder。解析 该函数在 sklearn.preprocessing 类中,格式为:OneHotEncoder(n_values=’auto’, cate
转载
2024-04-01 11:34:21
38阅读
本篇主要介绍TextCnn针对中文的分本分类的代码实现。下一篇计划讲模型训练及线上文本分类。代码基于开源代码 https://github.com/dennybritz/cnn-text-classification-tf 建议对NLP文本分类或CNN不了解的先阅读我的上一篇blog及以下的大神blog :NLP文本分类入门学习及TextCnn实践笔记(一)参考的大神
转载
2024-04-26 14:50:41
35阅读
(封面图由ERNIE-ViLG AI 作画大模型生成) 【NLP相关】attention的代码实现Attention模型是现今机器学习领域中非常热门的模型之一,它可以用于自然语言处理、计算机视觉、语音识别等领域。本文将介绍Attention模型的代码实现。1. attention机制的原理首先,我们需要了解Attention模型的基本概念。Attention是一种机制,它可以用于选择和加权输入
转载
2023-10-18 18:37:08
98阅读
目的本文使用Python的sklearn类库,基于对机器学习线性回归算法的理论学习,利用sklearn中集成的波士顿房价数据,以此来对线性回归的理论知识进行一次实践总结。本文不以预测的准确率为目的,只是简单的对机器学习的线性回归等理论知识进行一次实践总结,以此来体验下sklearn类库的使用方法。美国波士顿房价的数据集是sklearn里面默认的数据集,sklearn内置的数据集都位于dataset
转载
2024-03-28 09:01:17
0阅读
文章目录前言一、目标文本是什么?二、模型调用步骤1.引入库2.导入模型,本文使用 t5-base3.使用分词器对目标文本进行分词4.对刚刚生成的分词结果进行目标语言的生成工作5.对生成的目标语言进行解码工作,就可得到目标语言的文本,并打印 前言Google的T5模型从2019年发布到今天雄风依旧;在翻译,文本分类,智能问答,文章摘要等方面都取得SOTA地位;本文使用T5的翻译功能完成 文本从一种
转载
2024-03-05 09:14:56
34阅读
随机森林鉴于决策树容易过拟合的缺点,随机森林采用多个决策树的投票机制来改善决策树,我们假设随机森林使用了m棵决策树,那么就需要产生m个一定数量的样本集来训练每一棵树,如果用全样本去训练m棵决策树显然是不可取的,全样本训练忽视了局部样本的规律,对于模型的泛化能力是有害的产生n个样本的方法采用Bootstraping法,这是一种有放回的抽样方法,产生n个样本而最终结果采用Bagging的策略来获得,即
转载
2024-04-29 11:24:39
68阅读
我就废话不多说了,大家还是直接看代码吧~clf=KMeans(n_clusters=5)#创建分类器对象fit_clf=clf.fit(X)#用训练器数据拟合分类器模型clf.predict(X)#也可以给新数据数据对其预测print(clf.cluster_centers_)#输出5个类的聚类中心y_pred= clf.fit_predict(X)#用训练器数据X拟合分类器模型并对训练器数据X进
转载
2023-09-18 19:03:24
122阅读
一进官网就能看到它的6大功能:classificationRegressionClusteringDimensionality reductionModel selectionPreprocessing它的API模块包括:sklearn.base: Base classes and utility functionsklearn
无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程本篇文章将会带领大家了解什么是NLP模型当中的encoder-decoder和seq2seq。一、什么是 Encoder-Decoder ? 1、Encoder-Decoder 模型主要是 NLP 领域里的概念。它并不特指某种具体的算
转载
2023-09-25 10:39:24
99阅读
AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。导语:EMNLP,自然语言处理经
转载
2023-10-13 23:08:45
43阅读
了解了HMM之后,我们可以发现HMM有两个很明显的缺点:HMM定义的是联合概率,必须列举出所有可能出现的情况,这在很多领域是很困难的。在NLP领域,常知道各种各样但又不完全确定的信息,需要一个统一的模型将这些信息综合起来。HMM遵循一个假设:输出独立性假设。这要求序列数据严格相互独立才能保证推导的正确性,导致不能考虑上下文特征。而在NLP领域,上下文信息是很重要的。 因此,引入条件随机场(
转载
2023-08-12 15:18:02
124阅读
文章目录1 项目介绍1.1 背景知识介绍1.2 NLG的实现方式1.2.1 基于模板1.2.2 检索式1.2.3 生成式1.3 数据集介绍2 技术方案梳理2.1 模型介绍2.2 评价指标2.3 模型实现2.3.1 数据处理2.3.2 构建dataset2.3.3 模型定义2.3.4 训练相关参数2.3.5 训练结果 1 项目介绍1.1 背景知识介绍对话系统按领域分类,分为任务型和闲聊型。闲聊型对
转载
2024-01-08 12:28:37
28阅读
《How Transformers work in deep learning and NLP: an intuitive introduction》 2020年的确是 Transformer 年,从 NLP 进军到 CV。本文介绍一下 Transformer在 NLP 领域的应用。2017年的一篇非常有名的文章 “Attention is all you need”改变了我们对 Attenti
转载
2023-12-26 21:15:16
82阅读
NLP(Natural Language Processing )自然语言处理:是计算机科学,人工智能和语言学的交叉领域。目标是让计算机处理或“理解”自然语言,以执行语言翻译和问题回答等任务。NLU (Natural Language Understanding ) 自然语言理解:将人的语言形式转化为机器可理解的、结构化的、完整的语义表示,通俗来讲就是让计算机能够理解和生成人类语言。N
转载
2023-08-16 15:29:48
140阅读
一 、什么是自然语言处理(NLP)?1.NLP是一门横跨了计算机科学、人工智能以及语言学的学科,是人工智能的核心技术之一。目标是让计算机处理和理解自然语言从而可以处理一些实际任务。2.对语言层次的传统描述:重点放在句法分析(syntactic analysis)和语义理解(semantic interpretation)方面,简要描述左上角的语音信号分析。3.NLP的应用简单的说,拼写检查、关键字
转载
2023-11-10 06:29:15
52阅读