自动化特征工程是一项相对较新的技术,但在使用它基于真实的数据集解决了大量数据科学问题之后,我确信它应该成为机器学习工作流程的标准组成部分。在这篇文章里,我们将看到其中两个项目的结果和结论,以及托管在 GitHub 上的代码。每个项目都展示了自动化特征工程的一些优点:贷款还款预测:与手动特征工程相比,自动化特征工程可将机器学习开发时间缩短 10 倍,同时提供更好的建模性能。零售支出预测:自动化特征工
原创 2021-04-03 11:44:23
434阅读
向AI转型的程序员都关注了这个号????????????机器学习AI算法工程 公众号:datayx目前,很多机器学习项目的模型选择开始转向自动化,而特征工程仍然主要以人工为主。这个过程的...
原创 2021-10-26 16:53:00
168阅读
向AI转型的程序员都关注了这个号????????????机器学习AI算法工程 公众号:datayx目前,很多机器学习项目的模型选择开始转向自动化,而特征工程仍然主要以人工为主。这个过程的...
原创 2022-02-09 14:24:23
164阅读
本篇讲解使用自动化特征工程工具Featuretools,对数据进行自动化特征工程的方法,并借助于BigMart Sales数据集来演示自动化特征工程的相关应用。
原创 2022-03-22 01:19:59
9658阅读
在公众号「python风控模型」里回复关键字:学习资料特征工程意味着从现有数据中构建附加特征,这些数据通常分布在多个相关表中。特征工程需要从数据中提取相关信息并将其放入单个表中,然后可用于训练机器学习模型。构建特征的过程非常耗时,因为每个新特征通常需要几个步骤来构建,尤其是在使用来自多个表的信息时。我们可以将特征创建的操作分为两类:转换和聚合。让我们看几个例子,看看这些概念的实际应用。一个转化作用
推荐 原创 2022-01-14 12:04:26
1940阅读
1点赞
ML之FE:基于BigMartSales数据集利用Featuretools工具实现自动特征工程之详细攻略目录基于BigMartSales数据集利用Featuretools工具实现自动特征工程设计思路输出结果核心代码基于BigMartSales数据集利用
原创 2022-02-10 15:02:10
69阅读
ML之FE:基于BigMartSales数据集利用Featuretools工具实现自动特征工程之详细攻略目录基于BigMartSales数据集利用Featuretools工具实现自动特征工程设计思路输出结果核心代码基于BigMartSales数据集利用Featuretools工具实现自动特征工程设计思路更新……输出结果train.shape: (500, 12)test.shape: (200, 11)...
原创 2021-06-15 18:03:42
4465阅读
ML之FE:基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生目录基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生设计思路输出结果实现代码推荐文章ML之FE:基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生ML之FE:基于load_mock_...
原创 2021-06-15 18:00:16
2136阅读
1点赞
ML之FE:基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生目录基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生设计思路输出结果实现代码文章ML之FE:基于load_mock_customer数据集(模拟客户)
ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生文章ML之FE:基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生ML之FE:
ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生推荐文章ML之FE:基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生ML之FE:基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生实现1ML之FE:基于load_mo...
原创 2021-06-15 18:00:15
1598阅读
1点赞
ML之FE:基于单个csv文件数据集(自动切分为两个dataframe表)利用featuretools工具实现自动特征生成/特征衍生目录基于单个csv文件数据集(自动切分为两个dataframe表)利用featuretools工具实现自动特征生成/特征衍生设计思路1、定义数据集2、DFS设计输出结果feature_matrix_cats_df.csvfeature_matrix_nums.csv基于单个csv文件数据集(自动...
原创 2021-06-15 18:00:13
2197阅读
1点赞
ML之FE:基于单个csv文件数据集(自动切分为两个dataframe表)利用featuretools工具实现自动特征生成/特征衍生目录基于单个csv文件数据集(自动切分为两个dataframe表)利用featuretools工具实现自动特征生成/特征衍生设计思路1、定义数据集2
ML之FE:基于BigMartSales数据集利用Featuretools工具实现自动特征工程之详细攻略目录基于BigMartSales数据集利用Featuretools工具实现自动特征工程之详细攻略设计思路输出结果实现代码基于BigMartSales数据集
原创 2022-02-10 14:35:35
57阅读
ML之FE:基于BigMartSales数据集利用Featuretools工具实现自动特征工程之详细攻略目录基于BigMartSales数据集利用Featuretools工具实现自动特征工程之详细攻略设计思路输出结果实现代码基于BigMartSales数据集利用Featuretools工具实现自动特征工程之详细攻略设计思路输出结果实现代码...
原创 2021-06-15 18:00:11
1626阅读
1点赞
ML之FE:基于自定义数据集(银行客户信息贷款和赔偿)对比实现特征衍生(手动设计新特征、利用featuretools工具实现自动特征生成)目录基于自定义数据集(银行客户信息贷款和赔偿)对比实现特征衍生(T1手动设计新特征、T2利用featuretools工具实现自动特征生成)设计思路输出结果T1、
原创 2022-02-10 15:01:50
31阅读
ML之FE:基于自定义数据集(银行客户信息贷款和赔偿)对比实现特征衍生(手动设计新特征、利用featuretools工具实现自动特征生成)目录基于自定义数据集(银行客户信息贷款和赔偿)对比实现特征衍生(T1手动设计新特征、T2利用featuretools工具实现自动特征生成)设计思路输出结果T1、手动设计新特征T2、利用featuretools工具实现自动特征生成T2.1、79个Feature PrimitivesT2.2、深度特征合成:指通过叠加多个基元来得到特征
原创 2021-06-15 18:03:41
1549阅读
1、Featuretools1.1 Featuretools介绍Featuretools使用一种称为深度特征合成(Deep Feature Synthesis,DFS)的算法,该算法遍历通过关系数据库的模式描述的关系路径。当DFS遍历这些路径时,它通过应用于数据的操作(包括和、平均值和计数)生成综合特征。例如,对来自给定字段client_id的事务列表应用sum操作,并将这些事务聚合到一个列中。尽
ML之FE:基于单个csv文件数据集(自动切分为两个dataframe表)利用featuretools工具实现自动构造特征/特征衍生目录基于单个csv文件数据集(自动切分为两个dataframe表)利用featuretools工具实现自动构造特征/特征衍生设计思路1、定义数据集2、DFS设计输出结果feature_matrix_cats_df.csvfeature_matrix_nums.csv基
  • 1
  • 2