拓端tecdat|R语言时变波动率和ARCH,GARCH,GARCH-in-mean模型分析股市收益率时间序列

原文链接:http://tecdat.cn/?p=23225原文出处:拓端数据部落公众号自回归条件异方差(ARCH)模型涉及具有时变异方差的时间序列,其中方差是以特定时间点的现有信息为条件的。ARCH模型ARCH模型假设时间序列模型中误差项的条件均值是常数(零),与我们迄今为止讨论的非平稳序列不同),但其条件方差不是。这样一个模型可以用公式1、2和3来描述。

原创 点赞0 阅读39 收藏0 评论0 1 天前

拓端tecdat|游记数据感知旅游目的地形象

越来越多的人愿意精神消费。旅游不仅可以提升人们对外地环境和外地人文的认知,也可以放松身心、愉悦心情,是一种受欢迎的精神消费。 ▼   随着国内近些年来互联网的发展,越来越多的人开始线上消费,消费感受的推荐成为了潮流。在各个旅游平台上,越来越多的人愿意参与旅游目的地游玩感受的分享。   本文试图从马蜂窝旅游官网上就新疆这个旅游目的地游记进行感知分析。         游记表现出多元复杂的情感    

原创 点赞0 阅读76 收藏0 评论0 3 天前

拓端tecdat|R语言文本挖掘、情感分析和可视化哈利波特小说文本数据

一旦我们清理了我们的文本并进行了一些基本的词频分析,下一步就是了解文本中的观点或情感。这被认为是情感分析,本教程将引导你通过一个简单的方法来进行情感分析。 简而言之 本教程是对情感分析的一个介绍。本教程建立在tidy text教程的基础上,所以如果你没有读过该教程,我建议你从那里开始。在本教程中,我包括以下内容。 复制的要求:重现本教程中的分析需要什么? 情感数据集:用来对情感进行评分的主要数据

原创 点赞0 阅读69 收藏0 评论0 3 天前

拓端tecdat|R语言DTW(Dynamic Time Warping) 动态时间规整算法分析序列数据和可视化

动态时间规整(DTW,Dynamic time warping,动态时间归整/规整/弯曲)是一种衡量两个序列之间最佳排列的算法。线性序列数据如时间序列、音频、视频都可以用这种方法进行分析。DTW通过局部拉伸和压缩,找出两个数字序列数据的最佳匹配,同时也可以计算这些序列之间的距离。 DTW是干什么的? 动态时间规整算法,故名思议,就是把两个代表同一个类型的事物的不同长度序列进行时间上的“对齐”。比

原创 点赞0 阅读69 收藏0 评论0 3 天前

拓端tecdat|R语言Bootstrap的岭回归和自适应LASSO回归可视化

拟合岭回归和LASSO回归,解释系数,并对其在λ范围内的变化做一个直观的可视化。 # 加载CBI数据 # 子集所需的变量(又称,列) CBI_sub <- CBI # 重命名变量列(节省大量的输入) names(CBI_sub)[1] <- "cbi" # 只要完整案例,删除缺失值。 CBI_sub <- CBI_sub[complete.cases(CBI_sub),]

原创 点赞0 阅读70 收藏0 评论0 3 天前

拓端tecdat|R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况

逻辑回归是一种拟合回归曲线的方法,y=f(x),当y是一个分类变量时。这个模型的典型用途是在给定一组预测因素x的情况下预测y,预测因素可以是连续的、分类的或混合的。  一般来说,分类变量y可以是不同的值。在最简单的情况下,y是二进制的,意味着它可以是1或0的值。机器学习中使用的一个经典例子是电子邮件分类:给定每封电子邮件的一组属性,如字数、链接和图片,算法应该决定该电子邮件是垃圾邮件(1)或不是

原创 点赞0 阅读65 收藏0 评论0 3 天前

拓端tecdat|R语言分解商业周期时间序列数据:线性滤波器、HP滤波器、Baxter King滤波器、Beveridge Nelson分解等去趋势方法

分解南非GDP数据 本文包含各种过滤器,可用于分解南非GDP的方法。我们做的第一件事是清除当前环境中的所有变量。这可以通过以下命令进行。 rm(list = ls()) graphics.off()   载入数据 如前所述,南非的GDP数据将其作为时间序列存储在gdp中,我们执行以下命令。 gdp <- ts(dat.tmp, start = c(1960, 2), frequency

原创 点赞0 阅读28 收藏0 评论0 3 天前

拓端tecdat|R语言蒙特卡洛方法:方差分量的Metropolis Hastings(M-H)、吉布斯Gibbs采样比较分析

蒙特卡洛方法利用随机数从概率分布P(x)中生成样本,并从该分布中评估期望值,该期望值通常很复杂,不能用精确方法评估。在贝叶斯推理中,P(x)通常是定义在一组随机变量上的联合后验分布。然而,从这个分布中获得独立样本并不容易,这取决于取样空间的维度。因此,我们需要借助更复杂的蒙特卡洛方法来帮助简化这个问题;例如,重要性抽样、拒绝抽样、吉布斯抽样和Metropolis Hastings抽样。这些方法通

原创 点赞0 阅读15 收藏0 评论0 3 天前

拓端tecdat|R语言实现k-means聚类优化的分层抽样(Stratified Sampling)分析各市镇的人口

简介 假设我们需要设计一个抽样调查,有一个完整的框架,包含目标人群的信息(识别信息和辅助信息)。如果我们的样本设计是分层的,我们需要选择如何在总体中形成分层,以便从现有的辅助信息中获得最大的优势。 换句话说,我们必须决定以何种方式来组合辅助变量(从现在开始是 "X "变量)的值,来确定一个新的变量,称为 "分层"。 为此,我们必须考虑到抽样调查的目标变量"Y "变量:如果为了形成分层,我们选择与

原创 点赞0 阅读23 收藏0 评论0 3 天前

拓端tecdat荣获掘金社区入驻新人奖

2021年7月,由掘金发起了“入驻成长礼”颁奖活动。本次活动邀请到知名开发者、服务机构代表等业界人士。 据了解,掘金社区“新入驻创作者礼”主要对已经积累了一定历史文章的跨平台创作者进行激励。对于本次评选,社区结合网络投票进行综合评审,通过不同的奖项,对各个创作者对实现赋能技术世界未来发展的努力进行表彰,共创行业美好蓝图。    拓端tecdat荣获掘金颁发的“2021受欢迎入驻新人”奖,拓端数

原创 点赞0 阅读13 收藏0 评论0 3 天前

拓端tecdat|基于贝叶斯模型的随机森林预测方法分析汽车燃油经济性

这个例子展示了如何用Matlab实现贝叶斯优化,使用分位数误差调整回归树随机森林的超参数。如果你打算使用模型来预测条件量值而不是条件平均值,那么使用分位数误差而不是平均平方误差来调整模型是合适的。 加载和预处理数据 加载数据集。考虑建立一个模型,预测一辆汽车的燃油经济性中位数,给定它的加速度、汽缸数、发动机排量、马力、制造商、型号和重量。考虑将汽缸数、制造商和型号_年份作为分类变量。  Cyl

原创 点赞0 阅读18 收藏0 评论0 3 天前

Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例

回归算法最小角回归(LARS)通过高维数据的线性组合提供变量。它与正向逐步回归有关。在这种方法中,在每个步骤中选择最相关的变量,其方向在两个预测因子之间是等角的。    在本教程中,我们将学习如何用Python中的LARS和Lasso Lars算法拟合回归数据。我们将在本教程中估计住房数据集。这篇文章包括  准备数据 如何使用LARS 如何使用Lasso LARS  让我们从加载所需的包开始。 

原创 点赞0 阅读18 收藏0 评论0 3 天前

拓端tecdat|R语言混合线性模型、多层次模型、回归模型分析学生平均成绩GPA和可视化

混合模型在统计学领域已经存在了很长时间。例如,标准的方差分析方法可以被看作是混合模型的特殊情况。最近,混合模型有多种应用和扩展,使其能够涵盖各种不同的数据情况。 术语 对于不熟悉的人来说,围绕混合模型的术语,特别是跨学科的术语,可能有点令人困惑。你可能遇到的关于这些类型的模型的一些术语包括。 方差分量 随机截距和斜率 随机效应 随机系数 变化的系数 截距和/或斜率作为结果 分层线性模型 多层次模

原创 点赞0 阅读18 收藏0 评论0 3 天前

拓端tecdat|R语言使用虚拟变量(Dummy Variables) 回归分析工资影响因素

简介 本文与以下两个问题有关。你应该如何添加虚拟变量?你应该如何解释结果? 如果使用一个例子,我们可能会更容易理解这些问题。 数据 假设我们想研究工资是如何由教育、经验和某人是否担任管理职务决定的。假设 每个人都从年薪4万开始。 实践出真知。每增加一年的经验,工资就增加5千。 你学得越多,你的收入就越多。高中、大学和博士的年薪增长分别为0、10k和20k。 海面平静时,任何人都可以

原创 点赞0 阅读26 收藏0 评论0 3 天前

拓端tecdat|R语言结构方程SEM中的power analysis 效能检验分析

简介 本文对结构方程模型进行效能分析。 本文从一些简单的例子开始。其余部分提供了一些关于统计背景的说明,各种效应大小的定义,以及本包所含函数的详细描述。 背景介绍 数学模型的统计评价通常是通过考虑测试统计量来进行的,测试统计量表示观察数据和拟合模型的数据之间的差异。在SEM中,大小为N的样本的相关测试统计量由T = Fˆ(N - 1)给出。Fˆ表示所选差异函数(如最大似然)的最小化样本值,从而表

原创 点赞0 阅读126 收藏0 评论0 8 天前

拓端tecdat|R语言贝叶斯Poisson泊松-正态分布模型分析职业足球比赛进球数

在本文关于如何在R中进行贝叶斯分析。我们介绍贝叶斯分析,这个例子是关于职业足球比赛的进球数。 模型 首先,我们认为职业足球比赛的进球数来自分布,其中θ是平均进球数。现在假设我们用一位足球专家的意见来得出足球比赛的平均进球数,即参数θ,我们得到:。   curve(dnorm(x, 2.5, 0.2), from = -2, to = 8,...)       我们想知道什么? 在这种情况下,我们

原创 点赞0 阅读118 收藏0 评论0 8 天前

拓端tecdat|R语言量化:合成波动率指数移动平均策略分析标准普尔500波动率指数(VIX)

   To 本文目标是创建合成波动率指数,1)当应用于标准普尔500指数时,尽可能地反映VIX指数;2)完全依靠价格作为输入,因此它可以应用于任何市场指数。 所述的解决方案是合成波动率指数。> Mov(ATR(1)/C,20,S) 下面我将尝试代码。 #***************************************************************** # 加载

原创 点赞0 阅读115 收藏0 评论0 8 天前

拓端tecdat|Python中的多项式回归拟合非线性关系实例

多项式回归是独立x变量和因果y变量之间的非线性关系。当我们分析有一些弯曲的波动数据时,拟合这种类型的回归是必不可少的。在这篇文章中,我们将学习如何用多项式回归数据拟合曲线并在Python中绘制。我们在本教程中使用NumPy和matplotlib库。 我们将首先加载本教程所需的模块。 import numpy as np import matplotlib.pyplot as plt 我们需要测

原创 点赞0 阅读127 收藏0 评论0 8 天前

拓端tecdat|R语言中的copula GARCH模型拟合时间序列并模拟分析

在这个文章中,我们演示了copula GARCH方法(一般情况下)。 1 模拟数据   首先,我们模拟一下创新分布。我们选择了一个小的样本量。理想情况下,样本量应该更大,更容易发现GARCH效应。  ## 模拟创新 d <- 2 # 维度 tau <- 0.5 # Kendall's tau Copula("t", param = th, dim = d, df = nu) # 定义c

原创 点赞0 阅读111 收藏0 评论0 8 天前

拓端tecdat|R语言资产配置策略量化模型:改进的移动平均线策略动态回测

定量战术资产配置策略(QATAA)模型是使用10个月的移动平均线作为过滤器。如果在月末,资产的价格高于移动平均线,就留在市场中;否则就会离开市场。   10个月有什么特别之处;为什么10个月对所有资产和区制都是不变的。我提出了根据历史波动率来调整移动平均线回溯的想法。也就是说,在高波动时期,较短的移动平均线会让我们更快地离开市场,而在低波动时期,较长的移动平均线会让我们留在市场中。但是,这导致了更

原创 点赞0 阅读36 收藏0 评论0 8 天前

拓端tecdat|Matlab用深度学习长短期记忆(LSTM)神经网络对文本数据进行分类

 这个例子展示了如何使用深度学习长短期记忆(LSTM)网络对文本数据进行分类。 文本数据是有顺序的。一段文字是一个词的序列,它们之间可能有依赖关系。为了学习和使用长期依赖关系来对序列数据进行分类,可以使用LSTM神经网络。LSTM网络是一种递归神经网络(RNN),可以学习序列数据的时间顺序之间的长期依赖关系。 要向LSTM网络输入文本,首先要将文本数据转换成数字序列。你可以使用单词编码来实现这一点

原创 点赞0 阅读22 收藏0 评论0 8 天前

拓端tecdat|R语言线性混合效应模型(固定效应&随机效应)和交互可视化3案例

原文链接:http://tecdat.cn/?p=23050在本文中,我们将用R语言对数据进行线性混合效应模型的拟合,然后可视化你的结果。线性混合效应模型是在有随机效应时使

原创 点赞0 阅读289 收藏0 评论0 14 天前

拓端tecdat|R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

原文链接:http://tecdat.cn/?p=23061原文出处:拓端数据部落公众号数据集信息:这个数据集可以追溯到1988年,由四个数据库组成。克利夫兰、匈牙利、瑞

原创 点赞0 阅读184 收藏0 评论0 14 天前

拓端tecdat|R语言拟合扩展的Rasch模型分析试题质量

原文链接:http://tecdat.cn/?p=23068原文出处:拓端数据部落公众号Rasch 分析是获得客观的、最基本的累加型测量值(兼顾分析模型中的标准误和质量控制

原创 点赞0 阅读168 收藏0 评论0 14 天前

拓端tecdat|R语言有状态依赖强度的非线性、多变量跳跃扩散过程模型似然推断分析股票价格波动

原文链接:http://tecdat.cn/?p=23010跳跃扩散过程为连续演化过程中的偏差提供了一种建模手段。但是,跳跃扩散过程的微积分使其难以分析非线性模型。本文开发了一种方法,用于逼近具有依赖性或随机强度的多变量跳跃扩散的转移密度。

原创 点赞0 阅读202 收藏0 评论0 19 天前

拓端tecdat|R语言优化交易系统:用平行坐标图可视化系统参数优化结果

在交互式平行坐标图中,有一个很好的htmlwidgets的例子。你可以交互式地操作平行坐标图来放大有趣的观察结果。不久前,我读到了关于系统参数优化结果的可视化,使用应用程序来创建和操作回测结果。这个想法是通过改变系统参数来运行多个回测,

原创 点赞0 阅读155 收藏0 评论0 19 天前

拓端tecdat|R语言中贝叶斯网络(BN)、动态贝叶斯网络、线性模型分析错颌畸形数据

贝叶斯网络(BN)是一种基于有向无环图的概率模型,

原创 点赞0 阅读129 收藏0 评论0 21 天前

R使用LASSO回归预测股票收益

使用LASSO预测收益1.示例一个热门目标。只要有金融经济学家,金融经济学家一直在寻找能够预测股票回报的变量。对于最近的一些例子,想想Jegadeesh和Titman(1993),它表明股票的当前收益是由前几个月的股票收益预测的,侯(2007),这表明一个行业中最小股票的当前回报是通过行业中最大股票的滞后回报预测,以及...

原创 点赞0 阅读10000+ 收藏0 评论0 29 天前

虎扑社区论坛数据爬虫分析报告

以下是摘自虎扑的官方介绍:虎扑是为年轻男性服务的专业网站,涵盖篮球、足球、F1、NFL等赛事的原创新闻专栏视频报道,拥有大型的生活/影视/电竞/汽车/数码网上交流社区,聊体育谈兴趣尽在虎扑。二、数据说明使用的数据来源:2018/1/1~1/19 两周半内虎扑论坛步行街各子版块的所有帖子,去除关注度极低的帖子,总数为3....

原创 点赞0 阅读10000+ 收藏0 评论0 29 天前

SPSS中的多层(等级)线性模型Multilevel linear models研究整容手术数据

我们将使用整容手术数据说明两种中心化类型。将此文件加载到SPSS中。假设我们要中心化的变量BDI。

原创 点赞0 阅读10000+ 收藏0 评论0 29 天前
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8