虽然现在深度学习非常火,端到端的方法更加是非常流行,虽然在这些方法中特征工程显得没有那么重要,但是如果把特征理解成先验知识的话,如何在各自的任务将先验知识编码进去,现在仍然是一个比较火的问题。

但是对于传统的机器学习来说,特征工程可能是整个系统最最重要的部分。好的特征工程直接决定最后系统的效果,那么所说的特征到底是什么呢?

特征其实是对一个事物的客观属性描述!!

这里我说一点自己的理解用于备忘。

假如我们有一个机器学习系统需要对人的性别进行分类。

这属于经典的模式分类问题,处理步骤如下:

1)信息获取

2)预处理:对获取信号进行规范化等各种处理

3)特征提取与选择:将识别样本构造成便于比较、分析的描述量即特征向量

4)分类器设计:由训练过程将训练样本提供的信息变为判别事物的判别函数

5)分类决策:对样本特征分量按判别函数的计算结果进行分类


而第三步的特征选择的好坏直接决定最后的性能!

举例

机器学习系统需要对人的性别进行分类!

这个例子中特征到底是什么呢?特征其实是对一个事物的客观属性描述!!

比如对周杰伦男人(具体个体)来说,他的特征是什么呢?

比如他是一个歌手,身高1.75米,体重130斤,长得帅,有钱,皮肤黄色,头发短,有公司.....等等。

周杰伦的特征就是所有可以描述他的一切信息!

但是我们能不能将所有的特征考虑进去呢?

当然是没必要的!

很多特征对于我们要解决的问题其实是并没有多大帮助,比如我们要进行的男人和女人分类来说。头发的长度这个特征远远比皮肤颜色这个特征有用的多!

因为一般的男生头发较短,女生头发较长。而男生和女生的皮肤颜色一般区别不大。我们应该尽量选择要分类类别之间的差别大的特征。无论是从维度上考虑还是对最后系统的帮助上来看。

推荐阅读:

精选干货|近半年干货目录汇总

干货|机器学习零基础?不要怕,吴恩达课程笔记第三周!逻辑回归与正则

干货|机器学习零基础?不要怕,吴恩达机器学习课程笔记2-多元线性回归

          欢迎关注公众号学习交流~         

特征工程的特征理解(一)_JAVA

              欢迎加入交流群交流学习       


特征工程的特征理解(一)_JAVA_02