前面几篇文章介绍了回归分类的几个算法,它们的共同点是训练数据包含了输出结果,要求算法能够通过训练数据掌握规律,用于预测新输入数据的输出值。因此,回归算法或分类算法被称之为监督学习(Supervised Learning)。本篇文章将接触有别于监督学习的另一机器学习算法——无监督学习(Unsupervised Learning)。无监督学习是寻找缺乏标准答案的输入数据的规律。其中聚算法是无监督
目录1、介绍2、原理输入激活函数3、损失及其优化损失函数优化4、API5、案例:乳腺癌肿瘤预测数据集代码?作者介绍:双非本科大三网络工程专业在读,阿里云专家博主,专注于Java领域学习,擅长web应用开发、数据结构和算法,初步涉猎Python人工智能开发。?主页:@逐梦苍穹?回归与聚算法系列⭐①:概念简述⭐②:线性回归⭐③:欠拟合与过拟合⭐④:岭回归?您的一键三连,是我创作的最大动力?1、介绍目
在本文中,我对现代机器学习算法进行了简要梳理,我通过查阅转载众多博客和资料,基于实践中的经验,讨论每个算法的优缺点,并以机器学习入门者的角色来看待各个模型。主要内容来自《机器之心》:回归分类与聚:三大方向剖解机器学习算法的优缺点通俗理解:1.给定一个样本特征 , 我们希望预测其对应的属性值 , 如果是离散的, 那么这就是一个分类问题,反之,如果是连续的实数, 这就是一个回归问题。 2.如果给定
机器学习回归与聚算法思维导图线性回归 欠拟合与过拟合 岭回归分类算法:逻辑回归模型保存与加载无监督学习 K-means算法4.1 线性回归回归问题: 目标值 - 连续型的数据4.1.1 线性回归的原理2 什么是线性回归 函数关系 特征值和目标值 线型模型 线性关系 y = w1x1 + w2x2 + w3x3 + …
文章目录前言一、参数解析二、使用步骤1.导入数据2.操作步骤总结 前言 一、参数解析#最终结果会是基于Inertia(簇内平方和)来计算的n_init次连续运行后的最佳输出 k = KMeans(n_clusters=4,#的个数 init='k-means++',#可输入"k-means++","random"或者一个n维数组。这是初始化质心的方法,默
常用的分类算法包括: 决策树分类法 朴素的贝叶斯分类算法(native Bayesian classifier) 基于支持向量机(SVM)的分类器 神经网络法 k-最近邻法(k-nearest neighbor,kNN) 模糊分类法下文出处 常见的聚算法包括: ①基于划分的聚算法 k-means: 是一种典型的划分聚算法,它用一个聚的中心来代表一个簇,即在迭代过程中选择的聚点不一定是聚
2.2 聚  我们经常会碰到这样的问题:  1)如何通过一些特定的症状归纳某类特定的疾病?  2)谁是银行信用卡的黄金客户?  3)谁喜欢打国际长途,在什么时间,打到哪里?  4)对住宅区进行聚,确定自动提款机ATM的安放位置。  5)如何对用户WAP上网行为进行分析,通过客户分群进行精确营销?  除此之外,促销应该针对哪一客户,这类客户具有哪些特征?这类问题往往是在促销前首要解决的问题,对
一、时间序列对比分析:1,时间序列及其分类:  1)同一现象在不同时间上的相继观察值排列而成的数列;  2)时间序列:绝对数序列-时期序列(在一段时间内),时点序列(某一瞬间时间点),相对数序列,平均数序列;  3)原则:一致性,时间长短/总体范围/指标内容/计算方法和口径;2,时间序列的水平分析:  1)发展水平:现象在不同时间上的观察值;  2)平均发展水平:序时平均;在一段时间内所达到的一般
线性回归举例:预测房价、股票等希望输入一个(或多个)值,得到预测值线性回归具体做法量化收集到的特
原创 2022-08-01 10:37:21
108阅读
一、数据挖掘的常用方法利用数据挖掘进行数据分析常用的方法主要有分类回归分析、聚、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。分类分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个
1.回归分析1.1线性回归模型及参数解释回归分析是将可能存在相关关系的变量拟合成直线或者曲线,然后据此一方面总结已有数据的规律和特征,另一方面预测数据。导入数据“人工坐席接听数据.xlsx”在工作表1,将【人工服务接听量】放入【列】,将【呼入案头总时长(秒)】放入【行】。点击【分析】,取消【聚合度量】的勾选。第一种添加趋势线方式选择【整个视图】,右击图表——【趋势线】——【显示趋势线】。这样就添加
转载 2024-01-02 10:43:51
0阅读
概况:数据挖掘对聚算法的要求:可伸缩性(在小数据集上算法优,同样要求在大数据集上算法优)、处理不同类型数据的能力、发现任意形状簇的能力、输入参数的领域知识最小化、处理噪声数据的能力、对输入数据顺序的敏感、可解释性和可用性、基于约束的聚、处理高维数据的能力。聚方法的分类:基于划分的方法:构建数据集的k个划分,每个划分表示一个聚(每个划分至少包含一个对象、每个对象只属于一个划分(可相应变动))
这篇博客是记录在数据挖掘中的回归时间序列分析的学习过程。
原创 2022-11-16 19:24:15
783阅读
作者 | 追光者本篇主要讲解AR,ARMA,ARIMA等传统时间序列模型,包括具体代码操作。并附讲时间序列的一些基础知识点,如果有基础的可以直接跳到模型部分。1. 时间序列的平稳性1.1 自协方差、自相关函数自协方差,指不同时点的变量之间的协方差自相关函数(autocorrelation function)ACF。自相关函数是指不同时点的变量之间的相关性。1.2 平稳性定义通俗理解一下时
  俗话说:“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。所谓,通俗地说,就是指相似元素的集合。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,在古老的分类学中,人们主要依靠经验和专业知识来实现分类,很少利用数学工具进行定量的分类。随着人类科学技术的发展,对分类的要求越来越高,以致有时仅凭经验和专业知识难以确切地进行
模型原理  Xgboost(Extreme Gradient Boost)模型,是一种特殊的梯度提升决策树(GBDT,Gradient Boosting Decision Tree),只不过是力求将速度和效率发挥到了极致,故叫X(Extreme)gradientboost。Xgboost其本质上还是基于树结构并结合集成学习的一种方法,其基础树结构为分类回归树(CART,Classification
一.基本概述Yt = f(Tt , St ,Ct ,It )Tt , St ,Ct ,It 分别表示时间序列t时刻的趋势成分,季节成分,循环成分,误差和无规则成分。 趋势模型:当时间序列呈现某种上升或下降的趋势,并且无明显的季节波动时,可以以时间t综合代替所有影响因素。季节模型: 二.趋势模型1.模型形式直线趋势模型非线性趋势模型有增长上限的曲线趋势模型 2.模型选择
     聚:所谓物以类聚,人以群分,聚类分析就是依照某种评价准则根据数据中对象的相似程度分成多个;同一个聚中的对象相关性高,彼此相似,不同聚之间 的对象相关性低,彼此相异。聚类分析算法有划分方法、层次聚、基于密度的聚和基于网格的聚等几种主要的聚策略;1.基于层次的聚方法    &nb
文本的聚,就是为了解决大批量文本的自动分类的问题。之前遇到过这样一个问题,就是有一堆文章的数据,想要得到这些文章对应的类别。但是这堆文章的数据里面并没有分类的信息,要是按照传统方式,需要人工对每篇文章都进行分类处理,但是这样的分类处理的速度太慢了,而且对于人工来说,工作量也是极其庞大的。是典型的吃力不讨好的一个活,那么有没有什么方法能够对这些数据进行简单的自动聚呢,也就是无监督对这些文本进行分
对机器学习算法进行分类不是一件容易的事情,总的来看,有如下几种方式:生成与判别、参数与非参数、监督与非监督等等。在机器学习中,有个定理被称为「没有免费的午餐」。简而言之,就是说没有一个算法可以完美解决所有问题,而且这对于监督学习(即对预测的建模)而言尤其如此。在本次梳理中,我们将涵盖目前「三大」最常见机器学习任务:回归方法,分类方法,聚方法。1、回归方法      
  • 1
  • 2
  • 3
  • 4
  • 5