之前我以为主成分分析用协方差矩阵→散度矩阵,而fa用相关系数矩阵,这也是区别之一。但事实上先对数据进行标准化后,其协方差矩阵就是相关系数矩阵(忘了在哪看的了)。还有一点,fa的因子载荷矩阵是特征值开根号*特征向量,而pca的好像没开根号?继续学习了一下,大致可以认为,主成分分析是因子分析的前半部分。 具体可见参考文献1: 重点看文献1中关于两种分析方式的步骤,以及对于差异的总结。 Fa就是在pca            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-27 14:09:56
                            
                                72阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            因子分析系列博文: 因子分析 factor analysis (一 ):模型的理论推导 因子分析 factor analysis (二 ) : 因子分析模型 因子分析 factor analysis (三) : 因子载荷矩阵的估计方法因子分析 factor analysis (四) : 因子旋转(正交变换) 因子分析 factor analysis (五) : 因子得分因子分析 fact            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-08 23:51:23
                            
                                339阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1 总体的\(k\)-因子模型1.1 模型设定固定\(k\lt r\),则\(k\)因子模型的设定为其中\(f\)为\(k\)维随机向量,称为共同因子(common factor),\(A\)为\(d\times k\)的线性变换,称为因子载荷(factor loading)。一般会做出这些假设:\(f\sim(0,I_k)\),\(\epsilon\sim(0,\Psi)\)(其中\(\Psi\            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-22 18:22:46
                            
                                57阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            因子分析——建立载荷矩阵到这里已经学了好多的多元分析方法了,有聚类分析法,有主成分分析法,尤其是主成分分析法,为什么还要讨论因子分析法呢?很多地方都有对主成分分析法和因子分析法的区别比较,这里就不多说了,只记录一下最重要的地方。 主成分分析法:是对原始变量的线性组合,且相互垂直。因子分析法:研究众多变量之间的内部依赖关系,潜在的假想变量+随机变量的线性组合。  因子载荷,反映了            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-29 23:20:15
                            
                                13阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # 如何用 Python 获取因载荷矩阵
在数据分析和机器学习中,因载荷矩阵是一个重要的概念。它通常用于特征提取,尤其是在主成分分析(PCA)和因子分析中。本文将教你如何使用 Python 来获取因载荷矩阵。以下是你需要遵循的流程:
## 流程步骤
| 步骤 | 描述                                  |
|------|-------------------            
                
         
            
            
            
            学习笔记 | 主成分分析[PCA]及其若干应用 1 背景说明  2 算法原理  2.1 PCA简介 2.2 基本原理 2.3 形式化表达 3 算法步骤与代码  4 PCA实例与应用  4.1 PCA的实质 4.2 用PCA降维 4.2.1 语音性别识别数据集 4.2.1 MNIST数据集 4.3 用PCA做数据可视化 4.4 用PCA做图像压缩 5 小结  概要:  前段时间学习了一些矩阵分解算            
                
         
            
            
            
            定义 主成分分析(Principal Component Analysis)也称为主分量分析,主要是利用降维的思想,把多指标转化为少数几个综合指标(即主成分),其中每一个主成分都能够反映原始变量的大部分信息,并且所含信息互不重复。  优点:降低数据的复杂性,识别最重要的多个特征。  缺点:不一定需要,且可能损失有用信息。  适用数据类型:数值型数据。求解由所选的解码函数所决定。具体地,为了简化解码            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-13 01:54:56
                            
                                220阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            应用岭回归的场景有很多。 本文介绍的是 在应用多元线性回归时 遇到多重共线性问题,且无法删除变量或者增加样本量的情况下,应用岭回归的情况。案例:互联网经济对中国经济增长影响基础模型:C-D生产函数:Y=A*L^α *K^β应用模型:岭回归使用工具:r语言使用程序包:‘MASS’、‘xlsx’、‘car’准备数据:Y:国民生产总值、K:固定资产投资;L:年期末就业人数;A:互联网综合发展水平数据处理            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-17 09:37:00
                            
                                233阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            本文主要介绍总体及样本的主成分的概念,如何可视化,以及一些最基本的性质。1 总体的主成分考虑\(x\sim (\mu,\Sigma)\),其中\(\Sigma\)可分解为\(\Sigma=\Gamma\Lambda\Gamma'\),\(\Gamma=(\eta_1,\ldots,\eta_d)\),各列为单位特征向量,\(\Lambda\)为特征值降序排列的对角矩阵,协方差矩阵的秩\(\text            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-12 10:08:07
                            
                                593阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            主成份分析是最经典的基于线性分类的分类系统。这个分类系统的最大特点就是利用线性拟合的思路把分布在多个维度的高维数据投射到几个轴上。如果每个样本只有两个数据变量,这种拟合就是 其中和分别是样本的两个变量,而和则被称为loading,计算出的P值就被称为主成份。实际上,当一个样本只有两个变量的时候,主成份分析本质上就是做一个线性回归。公式本质上就是一条直线。 
 
  插入一幅图            
                
         
            
            
            
            【机器学习算法实现】主成分分析(PCA)——基于python+numpy@author:wepon1、PCA算法介绍主成分分析(Principal Components Analysis),简称PCA,是一种数据降维技术,用于数据预处理。一般我们获取的原始数据维度都很高,比如1000个特征,在这1000个特征中可能包含了很多无用的信息或者噪声,真正有用的特征才100个,那么我们可以运用PCA算法            
                
         
            
            
            
            True Positive:真正类(TP),样本的真实类别是正类,并且模型预测的结果也是正类。
False Negative:假负类(FN),样本的真实类别是正类,但是模型将其预测成为负类。(统计学上的第二类误差(Type II Error))            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-01 15:03:41
                            
                                699阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # 主成分分析(PCA)结果解读:载荷矩阵的实现
主成分分析(PCA)是一种降维技术,能帮助我们更好地理解数据的主要特征,尤其在处理高维数据时。而载荷矩阵(loadings matrix)是PCA结果中一个重要的部分,它显示了原始变量与提取的主成分之间的关系。本文将指导您如何在Python中实现PCA,并解读载荷矩阵。
## 流程概述
以下是实现PCA并解读载荷矩阵的主要步骤:
| 步骤            
                
         
            
            
            
            Python中的Numpy包提供了强大的矩阵运算能力,下面我们简单的介绍一下这些运算的代码,让大家能够顺利地使用numpy去实现这些基本运算。除此之外我还将介绍一些矩阵基本概念的通俗理解,持续更新中……首先我们要导入numpy这个包,两种导入方式:In [1]: from numpy import *In [2]: import numpy as py个人建议使用第二种方式,这里由于我们要演示绝大            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-24 20:44:16
                            
                                89阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            在Python中使用K-Means聚类和PCA主成分分析进行图像压缩各位读者好,在这片文章中我们尝试使用sklearn库比较k-means聚类算法和主成分分析(PCA)在图像压缩上的实现和结果。 压缩图像的效果通过占用的减少比例以及和原始图像的差异大小来评估。 图像压缩的目的是在保持与原始图像的相似性的同时,使图像占用的空间尽可能地减小,这由图像的差异百分比表示。 图像压缩需要几个Python库,            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-25 13:31:18
                            
                                55阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            最近在研究机器学习相关内容,后面会尽量花时间整理成一个系列的博客,然后朋友让我帮他实现一种基于SVR支持向量回归的图像质量评价方法,然而在文章的开头竟然发现 灰度共生矩阵这个陌生的家伙,于是便有此文。1.灰度共生矩阵生成原理     灰度共生矩阵(GLDM)的统计方法是20世纪70年代初由R.Haralick等人提出的,它是在假定图像中各像素间的空间分布关系包含了图像纹理信息的前提下,提出的具有            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-24 21:35:15
                            
                                217阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            参考链接:图像纹理——灰度共生矩阵知乎——提取图像的颜色、纹理特征(传统算法)灰度共生矩阵(Gray-level Co-occurrence Matrix,GLCM)原理灰度共生矩阵可反映灰度 值 和 空间 分布情况。 共生矩阵  的描述方法: 规定一个方向(如水平,垂直,对角线)和距离(一个像素、两个像素),矩阵中  的值由灰度为  和  的像素对在该方向和距离上出现的次数除以N得到(归一化),            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-16 14:53:25
                            
                                535阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            因子分析——建立载荷矩阵到这里已经学了好多的多元分析方法了,有聚类分析法,有主成分分析法,尤其是主成分分析法,为什么还要讨论因子分析法呢?很多地方都有对主成分分析法和因子分析法的区别比较,这里就不多说了,只记录一下最重要的地方。 主成分分析法:是对原始变量的线性组合,且相互垂直。因子分析法:研究众多变量之间的内部依赖关系,潜在的假想变量+随机变量的线性组合。  因子载荷,反映了            
                
         
            
            
            
            # Python 主成分分析法与成份载荷矩阵
主成分分析(PCA,Principal Component Analysis)是一种广泛应用的降维技术,常用于从高维数据中提取重要特征。它通过线性变换将数据从原始空间转换到一个新的空间,新的空间中的每一维度(即主成分)都是原始特征的线性组合。本文将详细介绍PCA的过程及其成份载荷矩阵,并提供相应的Python代码示例。
## 1. PCA的基本概念            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-09-28 05:15:59
                            
                                1029阅读
                            
                                                                             
                 
                
                             
         
            
            
            
                    在进行二分类或多分类任务中为了直观的看出分类效果,以及为后续的错误分析做准备,需要计算整个分类的混淆矩阵,此中涉及到的是分类准确率和召回率的计算:准确率(精度):预测正确值占预测为该类别总体的比例召回率:预测正确值占该类别中所有预测值的比例正对角线表示预测正确的值,其余值为预测错误的值二分类:分类效果只有1和0之            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-25 22:11:32
                            
                                120阅读
                            
                                                                             
                 
                
                                
                    