机器学习算法,就是基于大量经验数据对某个问题进行预测的算法;1、机器学习分类从训练特点,可以分为监督学习、无监督学习、半监督学习; 从解决问题,可以分为分类算法,聚类算法,回归分析算法,推荐算法;2、数学基础向量: 就是一串数字,代表现实中某个事物的一系列特征和特征值相似度:用欧几里得距离来衡量相似度:用余弦相似度衡量:概率入门:联合概率 P(A^B) :多件事情都发生的可能性! 条件概率 P(A
线性回归:通过历史数据拟合出一条直线,用这条直线对新的数据进行预测。房价预测分析:package cn.doitedu.mlimport org.apache.log4j.{Level, Logger}import org.apache.spark.ml.evaluation.RegressionEvaluatorimport org.apache.spark.ml.linalgimport or
逻辑回归:是一个分类算法,它可以输出一个分类结果,同时输出分为此类的概率。1 根据业务理解,个人经验,框选大量的候选特征因素; 2 再用统计学在样本中求因素跟结论之间的相关度大小,来进行筛选。流失概率风险预测特征相关度package cn.doitedu.ml.lossimport org.apache.log4j.{Level, Logger}import org.apache.spark.ml
线性回归:通过用户流失概率预测:
机器学习算法,就是基于大量经验数据对某个问题进行预测的算法;1、机器学习分类从训练特点,可以分为监督学习、无监督学习、半监督学习;从解决问题,可以分为分类算法,聚类算法,回归分析算法,推荐算法;2、数学基础向量: 就是一串数字,代表现实中某个事物的一系列特征和特征值相似度:用欧几里得距离来衡量相似度:用余弦相似度衡量:概率入门:联合概率 P(A^B) :多件事情都发生的可能性!条件概率 P(A | B) = P(A^B)/ P(B) : B条件下A发生的概率贝叶斯公式 P(B
逻辑回归:是一个分类算法,它可以输出一个分类结果,同时输出分为此类的概率。1 根据业务理解,个人经验,框选大量的候选特征因素;2 再用统计学在样本中求因素跟结论之间的相关度大小,来进行筛选。流失概率风险预测特征相关度package cn.doitedu.ml.lossimport org.apache.log4j.{Level, Logger}import org.apache.spark.ml.linalgimport org.apache.spark.ml.linalg.Vectors
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号