1 主成分分析(PCA)主成分分析:将原始特征(变量)按一定的线性组合而成新的若干个变量,这些若干个变量就称为主成分,通常主成分个数少于自变量个数,从而达成降维目的。  主成分分析与SVD都是可以降维,那么它们的区别在哪?区别在于PCA需要先计算协方差矩阵,接着通过协方差矩阵进行与SVD相似的步骤;而SVD可以直接对矩阵进行分解。小知识:y=ax+b, x为自变量,y为因变量(            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-18 16:53:13
                            
                                20阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            单行注释和多行注释Python源代码注释有两种形式:单行注释:Python中使用井号(#)表示单行注释多行注释:Python中使用三个单引号或三个多引号进行多行注释变量Python使用等号(=)作为赋值运算符。Python是弱类型语言,有两个典型特点:变量无需声明即可直接赋值:对一个不存在的变量赋值就相当于定义了一个新变量;变量的数据类型可以动态改变:同一个变量可以一会儿赋值为整数,一会儿赋值为字            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-17 13:10:42
                            
                                102阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            因子分析用Python做的一个典型例子一、实验目的采用合适的数据分析方法对下面的题进行解答二、实验要求采用因子分析方法,根据48位应聘者的15项指标得分,选出6名最优秀的应聘者。三、代码import pandas as pdimport numpy as npimport math as mathimport numpy as npfrom numpy import *from scipy.sta            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-21 23:33:52
                            
                                129阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            还记得我们在前面采用的回测工具Backtrader吗?Backtrader是一款非常灵活的回测工具,基于它你能回测任何你想要测试的idea.但是针对单因子回测,Backtrader 开发回测代码以及生成报告上并不算很方便,我们需要自己编写买卖逻辑,在生成的报告上也没有IC、IR、回撤等的数据分析,而实际上,从单因子回测的技术实现角度上来说,这些都是可以自动化生成的。Alphalens就是一个专门实            
                
         
            
            
            
            学习目标:  一、多因子的筛选阶段介绍   1.1 挖掘因子的过程  二、单因子有效性分析 - 目的    三、单因子有效性分析 - 因子IC分析 (信息系数 Information Coefficient)    3.1 信息系数IC的定义&nbs            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-07 16:18:54
                            
                                7阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # 使用Python进行五日动量因子的单因子检验
在金融市场中,因子分析是一种常用的工具,帮助投资者识别潜在的投资机会。本文将重点介绍如何使用Python进行五日动量因子的单因子检验,并给出相关的代码示例。
## 什么是动量因子?
动量因子是指通过过去一段时间内的收益来预测未来收益的策略。五日动量因子特别关注过去五天的股票回报,假设短期内表现良好的股票在将来几天也会继续表现良好。
## 概            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-10-04 05:19:15
                            
                                190阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            目录一、建立回归模型二、判断有无自相关性(1)图示检验法1(2)图示检验法2(3)DW检验法三、迭代法处理自相关四、差分法处理自相关五、不同处理方法的选择由上图可知,散点图结果大部分落在了第Ⅰ,Ⅲ象限,表明随机扰动项存在正的序列相关。(3)DW检验法相关知识:0≤DW≤误差项ε间存在正自相关<DW≤不能判定是否有自相关<DW<4-误差项间无自相关4-≤DW<4-不能判定是否            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-01 08:42:47
                            
                                31阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1. 梯度下降算法推导模型的算法就是为了通过模型学习,使得训练集的输入获得的实际输出与理想输出尽可能相近。 极大似然函数 的本质就是衡量在某个参数下, 样本整体估计和真实情况一样的概率 , 交叉熵函数 的本质是衡量样本 预测值与真实值之间的差距 ,差距越大代表越不相似1. 为什么要最小化损失函数而不是最大化模型模型正确            
                
         
            
            
            
            导语彼得 林奇的PEG策略:
投资大师彼得·林奇(Peter Lynch)有过一个著名的论断:任何一家公司股票如果定价合理的话,市盈率就会与收益增长率相等PEG概念解析EPS(Earnings Per Share)表示每股收益(一般按年计算)EPS = \frac{increment per year}{stocknumbers}PE(Price to Earning Ratio)表示市盈率,是当            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-05 11:20:49
                            
                                10阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            本文试图构建一个通用的因子选股回测模型,来验证因子的有效性。什么是有效因子在构建因子选股回测模型之前,我们总结了一个有效因子的三个重要特征,它们是:①超额收益:一个有效因子,应当能筛选出好的股票组合,创造出跑赢大盘的超额收益。②持续性:一个有效因子,应当是在一个较长的时间段内持续有效,而不是仅仅在一个季度、一个年份有效。 ③稳定性:一个有效因子,不仅是对一个市场有效,而是在所有市场都有效,能够跨市            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-08 18:01:02
                            
                                40阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            收益率预测模型中常用到线性因子模型,其是通过线性等式的关系,将有限个数的因子与资产的收益率或者价值联系在一起。本文通过因子线性模型介绍了著名的夏普单指数模型与多因子模型,并介绍了常用的因子种类。线性因子模型的提出单因子模型,通俗的说,假如某件事情的发生仅用一个因子便可解释,这样建立的模型就可以称作单因子模型。比如说,今天下雨,很可能是因为水汽的积累太多了,那么是否下雨只受到空气中水分含量这个因子的            
                
         
            
            
            
            一、基本思想通过一个例子说明:        假设一个同学数学、物理、化学、生物都考了满分,那么可以认为这个同学的理性思维比较强。此时,我们所说的理性思维就是一个因子,在这个因子的作用下,偏理科的成绩才会这么高。        什么是因子分析?就是假设现有全部自变量x的出现是因为某个潜在变量的作用,这个潜在变量就是所谓            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-04 19:41:53
                            
                                101阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            因子分析用Python做的一个典型例子一、实验目的采用合适的数据分析方法对下面的题进行解答二、实验要求采用因子分析方法,根据48位应聘者的15项指标得分,选出6名最优秀的应聘者。三、代码import pandas as pd
import numpy as np
import math as math
import numpy as np
from numpy import *
from scip            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-28 12:27:35
                            
                                234阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            文章目录重磅开源 | 单因子分析工具 携新功能——因子看板强势来袭重磅开源,聚宽因子分析工具安装可视化输出属性列表使用实例结果展示重磅开源 | 单因子分析工具 携新功能——因子看板强势来袭日前,聚宽正式对外发布了单因子分析工具 jqfactor_analyzer 的开源代码地址,开发者们可以在 Github 上获取源代码并参与开发,希望可以和大家共同交流探讨。此外,为了便于监控因子表现,我们新上线            
                
         
            
            
            
            # Python 如何计算单因子ICIR
在金融领域,因子投资是一种常见的策略,其中因子的有效性需要通过统计方法进行评估。单因子信息比率(ICIR, Information Coefficient Information Ratio)是一种衡量因子预测能力的重要指标,评估因子的有效性和持久性。本文将详细说明如何使用Python计算单因子ICIR,并提供相应的代码示例。
## ICIR的定义            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-08-16 07:47:23
                            
                                406阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            实现单因子回测框架 Python
作为一名经验丰富的开发者,我将为你介绍如何实现基于 Python 的单因子回测框架。在开始之前,我们先来了解一下整个流程。下面是一个简化的流程图:
```mermaid
stateDiagram
    [*] --> 数据准备
    数据准备 --> 数据清洗
    数据清洗 --> 因子计算
    因子计算 --> 分组回测
    分组回测 -->            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-01-30 08:36:53
                            
                                678阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            在R语言当中有因子这个特殊的数据结构,和别的编程语言不同,这个数据结构的主要目的是用来分类,计算频数和频率,在后期将R语言用于统计学当中将会十分受用。并且在绘图当中,我们使用同样的数据,将其转化为因子之后,在将这些数据放入绘制图像的函数当中,图像将会变得更加具有可读性。我们有两种方式来创建因子这个数据结构,第一种是在数据框当中自动创建,另一种方式是直接创建因子。一.利用数据框创建因子第一种方式是使            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-16 09:51:47
                            
                                28阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            试验中要考察的指标称为试验指标,影响试验指标的条件称为因素(分类变量),因素所处的状态称为水平,若试验中只有一个因素改变则称为单因素试验,若有两个因素改变则称为双因素试验,若有多个因素改变则称为多因素试验。方差分析就是对试验数据进行分析,检验方差相等的多个正态总体均值是否相等,进而判断各因素对试验指标的影响是否显著,根据影响试验指标条件的个数可以区分为单因素方差分析、双因素方差分析和多因素方差分析            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-30 02:15:10
                            
                                93阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
             文章目录基本数据清洗流程1. 异常值处理(绝对中位差)2. 数据标准化3. 市值中性化4. 行业中性化完整示例程序 基本数据清洗流程下面都是对截面数据的一些基本处理流程,方便后续的分析与建模。基于截面数据的建模并不是说:当前截面的情况对应了未来就会如何如何,而是后验的去描述,未来表现如何如何时,历史上的截面数据大概有什么样子的表现1. 异常值处理(绝对中位差)原始数据的分布在使用一些拟合的方法时            
                
         
            
            
            
            刚才我            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-01-12 06:23:34
                            
                                610阅读
                            
                                                                             
                 
                
                                
                    