特征工程概述一、特征工程概述特征工程 = 数据准备(for
原创 2018-05-26 17:51:47
714阅读
一、特征选择–与降维的差异相同点:效果一样,都是试图减少数据集
原创 2018-06-14 13:37:45
177阅读
​​一、连续型变量​​​​1.1 连续变量无量纲化​​​​1.2 连续变量数据变换​​​​1.3 连续变量离散化​​​​二、类别变量编码​​​​三、时间型、日期型变量转换​​​​四、 缺失值处理​​​​五、 特征组合​​ 一、连续型变量1.1 连续变量无量纲化无量纲化: 使不同规格尺度的数据转化统一规格尺度(将数据单位统一)无量纲化方法:标准化, 区间所方法 x′=x−x¯¯¯σ 
原创 2018-06-14 13:09:06
165阅读
注意:1.本系列所有的文章主要是梯度提升树模型展开的,抽取的特征主要为帮助梯度提升树模型挖掘其挖掘不到的信息,本文介绍的所有特征都可以当做特征直接加入模型,和基于神经网络的策略有些许差别;2. 因篇幅过多
转载 2022-04-22 23:38:55
10000+阅读
原创 2021-09-08 13:08:29
585阅读
1. 最基本那肯定是STFT,说白了就是FFT加窗。有人肯定说这不算是feature,因为这是raw data,但是现在深度学习已经越来越多的使用这种raw data作为“feature” 输入到网络让模型自己学习其中的特征。其物理含义也十分明确:就是把时间信号转换为时间-频率的信号,根据FFT的窗长和选择的窗函数来决定时间-频率分辨率的tradeoff。说白了就是直接让你看每一段时间内的频率成分
转载 8月前
64阅读
HOG特征:方向梯度直方图(Histogram of Oriented Gradient,)特征是一种全局图像特征描述子。 它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行...
转载 2017-03-16 15:32:00
488阅读
2评论
https://scm_mos.gitlab.io/slam/text_feature/
原创 2023-02-05 09:55:08
111阅读
AI学习---特征工程
原创 2022-02-17 16:44:40
840阅读
1点赞
1评论
原创 lightcity 光城 2018-10-14特征工程之特征关联      0.说在前面1.皮尔逊2.pointbiserialr系数3.Spearman's 系数4.总结5.作者的话0.说在前面昨天学习了seaborn绘制图形,以及单变量与多变量之间的绘图,那么今天从统计学角度实战分析在处理特征工程过程中所涉及的三个相关系数(具体的三个系数数学推导,在后续更新)。为了更好的便于大家的交流,
c++
转载 2021-03-18 13:33:07
318阅读
特殊的特征处理比如时间和地理位置
转载 2019-05-17 02:33:00
90阅读
2评论
特征提取——颜色特征 颜色直方图 OpenCV之颜色空间: 颜色空间RGB(Red 红色,Green 绿色,Blue 蓝色) R的取值范围:0-255 G的取值范围:0-255 B的取值范围:0-255 颜色空间HSV (Hue 色相,Saturation 饱和度,intensity 亮度) H的取值范围:0-179 S的取值范围:0-255 V的取值范围:0-255 颜色空间HLS (Hue 色
原创 2023-06-07 18:28:10
2518阅读
---脚本语言(scripting language) ---高级动态编程语言 简单易学 Python是一种代表简单主义思想的语言。Python的这种伪代码本质是它最大的优点之一。它使你能够专注于解决问题而不是去搞明白语言本身。Python有极其简单的语法,极易上手。 解释性&编译性 -Python语言写的程序不需要编译成二进制代码。可以直接从源代码运行程序,但
转载 2023-08-12 22:35:14
76阅读
特征工程之特征关联0.说在前面昨天学习了seaborn绘制图形,以及单变量与多变量之间的绘图,那么今天从统计学角度实战分析在处理特征工程过程中所涉及的三个相关系数(具体的三个系数数学推导,在后续更新)。为了更好的便于大家的交流,先建立一个微信总群,二维码在文章最后放出!【关键字】相关系数微信总群1.皮尔逊皮尔逊相关系数:Pearson correlation coeffici...
原创 2021-08-03 09:10:10
379阅读
为什么要进行maxpool? max pooling之后,仅保留了最代表性的pixel 浅层网络输出: 深层网络输出: 图1虽然人容易看,但特征不具有代表性,就是说不能通过一个特征就判定它是否是行人,之所以人看起来容易,是因为人做了后面深层网络做的东西。 图2比较难以区分,因为它已经对某些结构进行了 ...
转载 2021-09-07 14:13:00
769阅读
2评论
特征提取——局部特征 <!--more--> LOG,HOG,DOG微分算子在近圆的斑点检测方面效果很好 HOG特征 https://blog.csdn.net/coming_is_winter/article/details/72850511 https://blog.csdn.net/zouxy09/article/details/7929348/ 总结:Dalal提出的Hog特征
原创 2023-05-12 15:13:32
276阅读
在机器学习中,特征是指对象、人或现象的可测量和可量化的属性或特征特征可以大致分为两类:稀疏特征和密集特征
前言在之前的文章中,我们已经介绍过部分类别特征编码的内容,此处,我们将所有的内容进行整合为一个系列,我们不罗列过多的知识点,重点介绍在kaggle过往几年内中大家最为常用有效的类别编码技巧,如果对其它类型编码感兴趣的朋友可以学习扩展部分的内容。
转载 2022-04-22 23:37:37
10000+阅读
1、原理1.1、基本结构卷积神经网络(Convolutional Neural Networks,CNN)是深度学习中的一种网络,它和其他神经网络最大的区别在于其独特的卷积层。通常情况下它是由多层网络组合而成,每层又包含由特征图组成的多个平面,而这些平面都是由多个独立神经元组成。  通常情况下,因为包含卷积操作,C层被称为特征提取层。上一层的局部感受野(即与滤波器进行卷积操作的
转载 1月前
29阅读
问题在数据处理中经常会遇到特征太多造成的计算负担和一些其他的影响,如过拟合等,不但使得预测结果不准确,还消耗计算时间。所以特征选择就显得非常重要了。特征选择:从给定的特征集合中选取出相关特征子集的过程成为“特征选择”。通过这一操作,不仅能够减少特征的维度,也能得到更能体现目标值的几个特征。在周志华的《机器学习》中第十一章对于特征选择也是有所提到。在文章中大佬对于特征选择的方法分为三类:过滤式(fi
  • 1
  • 2
  • 3
  • 4
  • 5