Fama-French三因素模型简介  Fama-French三因素模型在CAPM的基础上增加了两个因子:市值因子和账面市值比因子。其中市场风险溢酬因子E(RM)-Rf对应了市场投资组合的收益率,市值因子SMB对应了做多市值较小的公司与做空市值较大的公司的投资组合带来的收益率(规模因子),账面市值比因子HML对应的是做多高book-to-market ratio公司、做空低book-to-mark
转载 2024-02-10 00:04:05
191阅读
有一维数组 [x1,x2...xn],要求一个值X,使得:F(X) = (X-x1)2+(X-x2)2+...(X-xn)2 = minF(X) = nX2 -  2 * (x1+x2+....+xn) + x12 + x22 + ...+xn2 = min 对X求导,当dF/dX = 0时,F(X)有极小值;2nX - 2 (x1+x2+....+xn) = 0 那
注: 本文是R语言sf包的核心开发者和维护者——来自德国明斯特大学的地理信息学教授: Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位、功能、开发现状及现存问题和今后展望,sf包是一个非常了不起的工具,在R语言中引入了空间数量分析领域通用的标准规范(simple feature),结合tidyverse工具箱组合
在一个试验中,有个处理平均数间比较时,其全部可能的相互比较对数有个,这种比较是复式比较,亦称多重比较(multiple comparisons)。为什么要做多重比较呢?方差分析后做多重比较有很多好处:误差由多个处理内的变异合并估计,自由度增大了,因而比较的精确度也增大了。检验显著,说明可以判定多个处理间存在显著的变异。因此方差分析后再做多重比较,称为Fisher氏保护性多重比较(Fisher's
1.单因素方差分析:适用于单因素A有两个水平或以上,研究个水平对因变量的影响正态假设条件:W检验shapiro.test():原假设为数据来自正态分布方差齐性条件:Bartlett检验(主要用于正态分布的数据) bartlett.test(x, g, ...)x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g。 当使用数据集时,也可以通过formula调用函数&
转载 2023-06-25 20:40:28
273阅读
  上一节我们对自然语言处理中词性标注的基本问题进行了描述,从本节开始我们将详细介绍HMM与词性标注的关系以及如何利用HMM进行词性标注。首先回顾一下隐马尔科夫模型(HMM)的定义和三大基本问题,并由此与词性标注的基本问题进行一个对比。   隐马尔科夫模型(HMM)是什么?说白了,就是一个数学模型,用一堆数学符号和参数表示而已,包括隐藏状态集合、观察符号集合、初始概率向量pi, 状态转移矩阵A,混
转载 2023-11-01 21:50:42
98阅读
Lasso的身世Lasso的思想从线性回归到Lasso认识LassoLasso相关文献 Lasso的身世Lasso全称为The Least Absolute Shrinkage and Selection Operator,是Tibshrani受到Breiman的Non-Negative Garrote(NNG)的启发在1996年提出的一种压缩估计方法,他把NNG的两步合并为一步,即L1-nor
转载 2024-01-19 23:26:17
70阅读
最近几年关于利用shiny做web框架的需求越来越多,出去交流也经常有爱好者咨询如何学习shiny包(个人觉得RStuido官网的shiny学习资料是最快上手的途径之一)。今天晚上刚好给学员直播完shiny包的基本知识,顺便也写一篇关于shiny的扫盲文章出来,希望能对想学习shiny包的朋友有一点点启发。Shiny是R中的一种Web开发框架,使得R的使用者不必太了解css、js只需要了解一些ht
转载 2023-08-31 20:35:25
84阅读
bigmemory: 管理大规模矩阵的共享内存以及映射文件1 描述bigmemory        bigmemory负责创建,存储,访问和操作大量的矩阵。矩阵,默认情况下会分配给共享内存并且可以使用内存映射文件。        biganalytics,&n
转载 2023-07-04 13:42:52
388阅读
本文主要介绍R语言中基本图形的绘制,包含以下几种图形:1.条形图 2.饼图 3.直方图 4.核密度图 5.箱线图 6.点图1.直方图的绘制 #直方图绘制 barplot(height) #height是一个向量或者矩阵 a<-c(1,2,3,4,5,6) #垂直直方图 barplot(a,main="Simple Bar Plot",xlab="
转载 2023-07-16 16:45:09
118阅读
动动大家的小手,一键三连一下,这对我有很大的帮助~实验1:关联规则R基本实现验证—apriori函数的简易使用mydata<-read.transactions(file="D:\\表6.1.csv")问题1.1:请描述上述命令的运行结果答:从D盘中读取表6.1.csv中的数据问题1.2:结合运行结果,请描述inspect 函数功能答:查看数据集的记录(如图1所示) 图1问题1.3
转载 2023-08-10 12:01:36
232阅读
R语言有两种不同的OOP机制,分别是从其前身S语言继承而来的S3 Object和S4 Object,其中S4 Object更加的正式、也是现在用于开发的主力军,所以本文就从S4 Object谈起,并在最后讨论一下古老的S3 Object。那我们就开始吧!首先我们来设计一个时间序列类,在它的内部,需要包含主数据、起始时间与截止时间、取样间隔这些数据。在R中我们可以定义如下:setClass("Ti
转载 2023-08-25 00:50:38
93阅读
关于softmax regression的数学模型部分可以参考Stanford的中英文Wiki:http://ufldl.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92 softmaxregR包的下载地址:https://cran.r-project.org/web/packages/softmaxreg/index.html一
玩转数据可视化之R语言ggplot2?个人主页:JoJo的数据分析历险记 ?个人介绍:小编大四统计在读,目前保研到统计学top3高校继续攻读统计研究生?如果文章对你有帮助,欢迎关注、点赞、收藏、订阅专栏本系列主要介绍R语言ggplot2的使用参考资料:ggplot2: Elegant Graphics for Data Analysis文章目录玩转数据可视化之R语言ggplot2?7.ggplot
转载 2023-07-04 14:12:26
229阅读
R操作关系型数据库基本要求: R语言基础,懂得一定SQL语法, 懂得使用搜索引擎目标: 学会使用DBI操作SQLite数据库简介R本身不具备数据库操作能力,需要额外的扩展包--DBI(database interface)。DBI将数据库管理分为前端和后端。用户在前端使用对应的API, 经由DBI转换成相应的底层操作.DBI分为三个部分:数据库驱动, 负责与数据库进行交互,比如说与SQLite数据
转载 2024-04-26 09:20:49
91阅读
目录一、数据二、logistic回归1.拟合2.预测三、probit回归四、经典判别分析(线性、混合线性、灵活线性)五、交叉验证与比较一、数据脊柱数据(Column_2C.csv、Column_3C.csv)有两个版本,区别在于分为两类还是3类。不过是.dat文件,需要进行相应的转换或者直接下载我上传的文件,是已经对格式和数据经过处理,可以直接进行分析的csv文件。数据具有6个自变量(生物力学特征
转载 2023-09-11 12:41:45
138阅读
R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表,下面来为大家简单介绍一下标量标量是只含一个元素的向量,例如f <- 3、g <- "US"和h <- TRUE。它们用于保存常量向量函数c,是组合函数a <- c(1, 2, 5, 3, 6, -2, 4) b <- c("one", "two", "three") c <- c(TR
转载 2023-08-31 16:10:04
93阅读
  R语言是进行统计分析和可视化的优秀语言(其实机器学习和网页制作也可以用R,小声说~|ω`))  R语言  相信大家在利用R语言进行数据分析的时候可能会有大数据分析需求。所谓大数据,很好理解,就是大样本高维度数据,这样的数据在当今信息爆炸时代,很是常见。比如医学数据,数据量大,维度极高,因为医学的检测指标多,而且随着基因测序特别是二代测序等高通量测序(High-throughput sequen
转载 2023-05-28 15:09:11
210阅读
安装R和Rstuido软件 R语言是用于统计分析,图形表示和报告的编程语言和软件环境;Rstudio是编辑、运行R语言的最为理想的工具之一。1、官网下载R安装包 下载地址为:https://cran.r-project.org 进入链接,如下图所示,在页面顶部提供了三个下载链接,分别对应三种操作系统:Windows、Mac和Linux。请选择自己操作系统对应的链接,接下来我将以windows为例给
R语言是一种利基语言,除了研究学者和数据科学家,大部分的开发者对于这种动态语言都持欣赏的态度。当然,对于一个1993年首次开发的编程语言来说,R语言用户通过三百多万其实也没有太了不起。没错儿,R的年龄确实不算太小,但是由于缺乏JIT,所以R通常会很慢。R也是内存占用者,这是因为它有较大的对象,大量分配,并且有一个不移动的垃圾收集器。此外,R具有复杂的语义,这使得本科生和研究生很难在数据科学实验室中
转载 2023-09-07 21:18:28
117阅读
  • 1
  • 2
  • 3
  • 4
  • 5