前言上篇笔记我们利用MNIST数据集训练了一个手写数字识别的模型,但是准确率非常的低,维持在91%左右,我们可以尝试着将准确率提高到96%以上,在实验之前我们需要先了解一些基本的概念,本篇文章可能会有些枯燥,因为大多都是理论知识。本文重点激活函数代价函数拟合什么是激活函数?激活函数是干嘛的?想了解什么是激活函数,就要先了解神经网络的基本模型,下图所示为一单一人工神经网络的基本模型图: 神经网络
 LBP(Local Binary Patterns,局部二值模式)是提取局部特征作为判别依据的。LBP方法显著的优点是对光照不敏感,但是依然没有解决姿态和表情的问题。不过相比于特征脸方法,LBP的识别率已经有了很大的提升。在[1]的文章里,有些人脸库的识别率已经达到了98%+。 1、LBP特征提取最初的LBP是定义在像素3x3邻域内的,以邻域中心像素为阈值,将相邻的8个像素的
说话人识别(Speaker Recognition,SR),又称声纹识别(Voiceprint Recognition,VPR),顾名思义,即通过声音来识别出来“谁在说话”,是根据语音信号中的说话人个性信息来识别说话人身份的一项生物特征识别技术。便于比较,语音识别(Automatic Speech Recognition,ASR)是通过声音识别出来“在说什么”。为了简便,后文统一称为VPR。传统的
声纹识别绪论前言指纹信息、人脸信息和声纹(voice-print)信息作为人体固有的生物信息,是智能电子设备私有化部署及辅助辨认个体的媒介。目前,指纹和(3D)人脸作为智能电子设备解锁信息已经成功商用,典型的如智能手机、人脸打卡系统等。声纹因为其变化性较前两者强,如感冒和外界环境声音干扰,商用化步伐不如前两者。据悉,目前声纹满足安全性级别、作为个体生物信息解锁和认证媒介的应用是在金融领域——由中国
转载 2023-08-31 21:11:52
317阅读
Scikit-Learn是基于python的机器学习模块,基于BSD开源许可证。这个项目最早由DavidCournapeau 在2007年发起的,目前也是由社区自愿者进行维护。它的主要特点有操作简单、高效的数据挖掘和数据分析、无访问限制、在任何情况下可重新使用、建立在NumPy、SciPy和matplotlib基础上、使用商业开源协议--BSD许可证等。scikit-learn的基本功能主要被分为
转载 2024-06-06 21:43:12
93阅读
本篇blog是利用Python进行文章特征提取的续篇,主要介绍构建带TF-IDF权重的文章特征向量。 In [1]: # 带TF-IDF权重的扩展词库 # 在第一篇文档里 主要是利用词库模型简单判断单词是否在文档中出现。然而与单词的顺序、频率无关。然后词的频率对文档更有意义。因此本文将词频加入特征向量 In [2]:
转载 2023-11-23 22:51:20
216阅读
特征提取方法基础知识,将不同类型的数据转换成特征向量方便机器学习算法研究1.分类变量特征提取:分类数据的独热编码方法,并用scikit-learn的DictVectorizer类实现 2.机器学习问题中常见的文档特征向量:>>1)词库模型将文档转换成词块的频率构成的特征向量,用CountVectorizer类计算基本单词频次的二进制特征向量。>>2)通过停用词过滤
前言  语言是一种复杂的自然习得的人类运动能力。成人的特点是通过大约100块肌肉的协调运动,每秒发出14种不同的声音。说话人识别是指软件或硬件接收语音信号,识别语音信号中出现的说话人,然后识别说话人的能力。特征提取是通过将语音波形以相对最小的数据速率转换为参数表示形式进行后续处理和分析来实现的。因此,可接受的分类是从优良和优质的特征中衍生出来的。Mel频率倒谱系数(MFCC)、线性预测系数(LPC
经验模态分解(Empirical Mode Decomposition, EMD) 优点:能够对非线性、非平稳过程的数据进行线性化和平稳化处理,且经分解后的函数彼此正交,理论上互不相关,从而尽可能多的保留原始数据基本特征。计算步骤:通过计算原序列 Y(t) 的上下包络线的“瞬时平衡位置”,提取内在模函数(IMF)。原序列减去该内在模函数后得到的序列作为新的原序列重复计算,如此依次提取出N
(1)词袋(Bag of Words)表征 文本分析是机器学习算法的主要应用领域。但是,文本分析的原始数据无法直接丢给算法,这些原始数据是一组符号,因为大多数算法期望的输入是固定长度的数值特征向量而不是不同长度的文本文件。为了解决这个问题,scikit-learn提供了一些实用工具可以用最常见的方式从文本内容中抽取数值特征,比如说:标记(tokenizing)文本以及为每一个可能的标记(toke
转载 2024-01-15 02:07:13
75阅读
 网上发现一篇不错的文章,是关于图像特征提取的,给自己做的项目有点类似,发出来供大家参考。       特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。 特征的定义 &
图像特征按性质分有颜色,纹理,形状,空间关系,边缘,角点,区域,脊等。通常人的视觉是先从形状,区域和颜色纹理边缘特征快速判断目标,然后再从脊,角点细节上分析判断目标,如果还分析不出,就会动用大脑从空间关系特征进行综合分析。如果关注某个目标,则会以背景,颜色,纹理,形状,区域等特征过滤环境中的干扰目标区域,直接提取相关目标进行特征分析。从形状,区域,颜色,边缘等外部特征快速识别目标,一般采用提取图像
另外加了些自己的理解一、原理:Sift算法的优点是特征稳定,对旋转、尺度变换、亮度保持不变性,对视角变换、噪声也有一定程度的稳定性;缺点是实时性不高,并且对于边缘光滑目标的特征提取能力较弱。  Surf(Speeded Up Robust Features)改进了特征提取和描述方式,用一种更为高效的方式完成特征提取和描述。二、Surf实现流程如下:1. 构建Hessian(黑塞矩阵
介绍FPN是一种利用常规CNN模型来高效提取图片中各维度特征的方法。在计算机视觉学科中,多维度的目标检测一直以来都是通过将缩小或扩大后的不同维度图片作为输入来生成出反映不同维度信息的特征组合。这种办法确实也能有效地表达出图片之上的各种维度特征,但却对硬件计算能力及内存大小有较高要求,因此只能在有限的领域内部使用。FPN通过利用常规CNN模型内部从底至上各个层对同一scale图片不同维度的特征表达
调用Python中的skimage库提取图像HOG特征的示例代码如下,代码摘自 图像特征工程 HOG特征描述子介绍:from skimage.io import imread, imshow from skimage.transform import resize from skimage.feature import hog from skimage import exposure i
#中文分词 def cut_word(text): text=" ".join(list(jieba.cut(text))) return text #中文文本的特征提取 def count_chinese_dome(): data=["10艘中俄军舰穿过津轻海峡,这一举措合乎国际法,无可指摘,却引起日本国内“异样反应”。" "19日,日本内阁官房
转载 2023-06-19 10:21:08
154阅读
什么是特征提取呢?      1.1 定义将任意数据(如文本或图像)转换为可用于机器学习的数字特征注:特征值化是为了计算机更好的去理解数据特征提取分类: 字典特征提取(特征离散化)文本特征提取图像特征提取(深度学习将介绍)1.2 特征提取APIsklearn.feature_extraction1.1 定义将任意数据(如文本或图像)转换为
转载 2024-01-05 16:10:58
280阅读
titching模块中对特征提取的封装解析(以ORB特性为例)      OpenCV中Stitching模块(图像拼接模块)的拼接过程可以用PipeLine来进行描述,是一个比较复杂的过程。在这个过程中,特征提取是重要的一个部分。由于OpenCV发展到了3.X以后,Stitching模块的相关函数进行了重新封装,所以对于学习研究造成了一定困难。这里通过解析代
HOGHOG 特征, histogram of oriented gradient, 梯度方向直方图特征, 作为提取基于梯度的特征, HOG 采用了统计的方式(直方图)进行提取. 其基本思路是将图像局部的梯度统计特征拼接起来作为总特征. 局部特征在这里指的是将图像划分为多个Block, 每个Block内的特征进行联合以形成最终的特征.1.将图像分块: 以Block 为单位, 每个Block以一定的
  4.1 Feature Extractorclass radiomics.featureextractor.RadiomicsFeaturesExtractor(*args, **kwargs)特征抽取器是一个封装的类,用于计算影像组学特征。大量设置可用于个性化特征抽取,包括:需要抽取的特征类别及其对应特征;需要使用的图像类别(原始图像/或衍生图像);需要进行什么样的预处理
  • 1
  • 2
  • 3
  • 4
  • 5