@回归回归(Regression)这一概念最早由英国生物统计学家高尔顿和他的学生皮尔逊在研究父母亲和子女的身高遗传特性时提出“子女的身高趋向于高于父母的身高的平均值,但一般不会超过父母的身高。”-- 《遗传的身高向平均数方向的回归》 如今,我们做回归分析时所讨论的“回归”和这种趋中效应已经没有任何瓜葛了,它只是指源于高尔顿工作的那样——用一个或多个自变量来预测因变量的数学方法。 在一个回归模型中,
转载
2024-05-14 16:47:10
1488阅读
01引言均值回归交易策略是一种经典的交易策略,可以追溯到很早的交易历史。其基本原理是当价格偏离其长期平均水平时,价格趋向于回归到其平均水平,这是由于市场的反复波动和回归特性所导致的。因此,该策略认为价格的偏离程度越大,回归的力度越大,可以通过采取相反的交易方向(即价格偏低时买入,价格偏高时卖出)来获取收益。均值回归交易策略的优点在于其简单易懂、操作便利、风险可控和适用范围广泛等特点。因此,该策略在
下面这段摘自百度百科: K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。代码里面并没有把K的值直接设为10,而是设为25.然后把这25簇分为10类(对应10个数字)。相当于K均值之后用最近邻再次分类,思路很赞,调整K的值可以无限逼近拟合现实。K值用来调整计算粒度。K与训练样本相同,
转载
2024-08-10 21:08:55
129阅读
树的构建算法 CART(Classification And Regression Trees, 分类回归树)的树构建算法。该算法可以用来分类也可以用来回归。 树回归 原理原理概述为了构建以分段常数为叶节点的树,需要度量出数据的一致性。首先计算所有数据的均值,然后计算每条数据的值到均值的差值。为了对正负差值同等看待,一般用绝对值或者平方值来代替上述差值。 方差是平方误差的均值(
转载
2024-08-01 12:18:17
75阅读
NO:01 “ 现在已然衰朽者,将来可能重放异彩。现在备受青睐者,将来却可能黯然失色。” 当事物发展严重偏离其均值时,均值会像万有引力一样令其回归。如果时间足够长,万物都终将回归于其均值。正所谓:盛极必衰,否极泰来。在金融学中,均值回归是价格偏离均价或价值一定程度后向其靠拢的规律。本质上,均值回归就是哲学思想中所说的『物极必反』。用大白话可以简单地概括为 “ 涨多必跌,跌多必涨
转载
2024-01-16 05:15:35
25阅读
线性回归(linear regression)是利用数理统计和归回分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。与之前的分类问题( Classification )不一样的是,分类问题的结果是离散型的;而回归问题中的结果是连续型(数值)的。数据特征数理统计中,常用的描述数据特征的有:**均值(mean):**又称平均数或平均值,是计算样本中算术平均数:**中位数(media
转载
2024-06-29 10:27:33
92阅读
一、基本思想假设,在长期大量的消费支出记录中,每个月最终的消费金额,与这个月中,任意一天的消费金额存在着一定的关系。同时我们假设这个关系可以用多元回归和均值回归任意种方式来描述,记作:多元回归:均值回归:接下来将对两种模型进行探究。二、步骤1、获取数据我从一份网上的账目清单中获取了一份支出报告。其中包含近八年共5572条消费记录: 由于我们只需要研究一个月里面,每天的支出和月总支出的关系,所以我们
转载
2024-08-16 13:12:32
228阅读
1评论
线性回归的模型思想回归的思想和分类有所不一样,分类输出的结果为离散的值,回归输出的是一个连续型的值。线性回归的思想就是试图找到一个多元的线性函数: 当输入一组特征(也就是变量X)的时候,模型输出一个预测值y = h(x),我们要求这个预测值尽可能的准确,那么怎么样才能做到尽可能准确呢?这要求我们建立一个评价指标来评价模型的在数据集上的误差,当这个误差达到最小的时候,模型
转载
2024-01-13 21:43:03
148阅读
数据集介绍波士顿房价数据集中有4个键,分别是数据、目标、特征名称和描述。数据集中共有506个样本,每个样本有 13个特征变量,后面还有一个叫做中位数的第14个变量,这个变量是业主自住房屋价格的中位数,以千美元为单位,这个变量就是该数据集中的target。 数据集介绍使用SVR进行建模先制作训练数据集和测试数据集,用SVR进行建模,用两种核函数Linear和rbf进行对比分析。X, y =
转载
2023-09-29 10:17:16
114阅读
回归(Regression)最早由高尔顿(1886)提出,他发现,子辈的平均身高是其父辈平均身高以及他们所处族群平均身高的加权平均和,即身高具有均值回归的倾向。这个均值本质上是条件均值(给定父辈和种群平均身高,子代身高的均值),经典回归模型事实上就是在估计条件均值。在经典回归模型中,我们希望用解释变量(regressand)的函数来预测被解释变量(regressor)。此时需要一个标准来测度与的接
转载
2024-04-03 10:48:09
591阅读
机器学习 | 回归评估指标1.回归评估指标1.1平均绝对误差 MAE1.1.1Sklearn 计算 MAE1.2均方误差 MSE1.2.1Sklearn 计算 MSE1.3判定系数 R^2^1.3.1 Sklearn 计算 R^2参考资料 1.回归评估指标1.1平均绝对误差 MAEMAE:Mean Absolute Error)平均绝对误差,从图形上看,MAE 就相当于将数据点与拟合之间之间的距
转载
2024-05-30 09:10:27
53阅读
二分类问题与logistic 回归 回归问题 “回归”一词源自英国科学弗朗西斯·高尔顿(Francis Galton),他还是著名的生物学家、进化论奠基人查尔斯·达尔文(Charles Darwin)的表弟。高尔顿发现,虽然有一个趋势——父母高,儿女也高;父母矮,儿女也矮,但给定父母的身高,儿女辈的平均身高却趋向于或者“回归”到全体人口的平均身高。换句话说,即使父母双方都异常高或者异常矮,儿女
转载
2024-05-18 11:41:24
606阅读
目录一、深入理解回归:二、误差分析:三、最大似然估计: 四、高斯分布-概率密度函数:五、误差总似然:六、最小二乘法MSE:七、总结归纳:一、深入理解回归: 回归简单来说就是“回归平均值”(regression to the mean)。但是这里的 mean 并不是把 历史数据直接当成未来的预测值,而是会把期望值当作预测值。 追根溯源回归这个词是一个叫高尔顿的人发明的,他通过大量观察数据
“ 现在已然衰朽者,将来可能重放异彩。现在备受青睐者,将来却可能黯然失色。” 当事物发展严重偏离其均值时,均值会像万有引力一样令其回归。如果时间足够长,万物都终将回归于其均值。正所谓:盛极必衰,否极泰来。 在金融学中,均值回归是价格偏离均价或价值一定程度后向其靠拢的规律。本质上,均值回归就是哲学思想中所说的『物极必反』。用大白话可以简单地概括为 “ 涨多必跌,跌多必涨 ” 。&nbs
# Python布林线均值回归策略
布林线均值回归策略是一种基于布林线指标的交易策略,通过利用布林线的上下轨道和均值线,来进行买卖点的判断。在Python中,我们可以利用一些库来实现这一策略,如pandas、numpy和matplotlib等。
## 布林线指标简介
布林线指标是由美国股票分析师约翰·布林格(John Bollinger)创造的一种技术分析工具,它由三条轨道线组成,中间是均值
原创
2024-04-23 05:47:39
261阅读
“python时变系数均值回归模型”用于研究具有时变特征的数据,能够适应变化的趋势和模式。以下将详细记录如何实现这一模型的过程,包括环境准备、分步指南、配置详解、验证测试、优化技巧和扩展应用。
### 环境准备
为了顺利实施 Python 时变系数均值回归模型,需确保硬件与软件环境的良好配置。
#### 软硬件要求
- **硬件要求**:
- 处理器: 至少四核CPU
- 内存: 至少
高尔顿与回归分析的起源 “回归”是由英国著名生物学家兼统计学家高尔顿(Francis Galton,1822~1911.生物学家达尔文的表弟)在研究人类遗传问题时提出来的。为了研究父代与子代身高的关系,高尔顿搜集了1078对父亲及其儿子的身高数据。他发现这些数据的散点图大致呈直线状态,也就是说,总的趋势是父亲的身高增加时,儿子的身高也倾向于增加。但是,高尔顿对试验数据进行了深入的分析,发
转载
2024-05-06 21:31:54
212阅读
## R语言均值回归策略实现流程
### 1. 数据准备
在实现均值回归策略之前,首先需要准备好相关的数据。数据可以是股票、商品或其他金融资产的价格数据。在本例中,我们以股票价格数据为例进行说明。
首先,需要导入需要用到的R包,包括`quantmod`、`PerformanceAnalytics`和`TTR`。通过`quantmod`包可以方便地获取金融数据,`PerformanceAnal
原创
2023-08-25 05:40:42
163阅读
均值回归策略是一种基于统计套利的量化交易策略,它利用价格的短期偏离和长期均值的回归关系进行交易。该策略的核心思想是,当价格偏离其长期均值时,存在一种趋势,即价格将回归到其均值水平。这个策略源自于《统计套利策略》(Statistical Arbitrage)一书中对量化交易策略的介绍。在这个策略中,交易者会选择一对或多对相关性较高的金融资产(如股票、期货、货币对等),并计算它们的价格之间的差异或距离
概念以及形式谬误谬误本质典例偷换概念在同一论证过程中,概念并没有保持一致【典例】买一送一。 【分析】两个“一”的含义往往不同循环定义在定义过程中,定义项直接或者间接地包含了定义项【典例】逻辑学是研究逻辑的科学。【分析】用“逻辑”来定义“逻辑学”,实际上并未定含了被定义清楚什么是逻辑学分解谬误认为整体具有的性质,部分一定具有【典例】湖北人能喝酒,焕哥是湖北人。因此,焕哥能喝酒。【分析】喝酒是湖北人整