1 标准误1.1 定义标准误(Standard Error)是用来衡量统计样本估计量(如均值、回归系数等)与总体参数之间的差异的一种统计量。标准误衡量了样本估计量的变异程度,提供了对总体参数的估计的不确定性的度量。标准误越小,表示样本估计量与总体参数的估计越接近,估计越稳定。1.2 计算公式2 聚类稳健标准误聚类稳健标准误的计算方法通常涉及到对观察数据进行分组,然后在每个组内计算残差平方,并最终将            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-01 21:27:17
                            
                                1874阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Stata进阶2在一般的模型中,被解释变量的取值是连续的,如果解释变量是离散的(比如,虚拟变量),则不会影响回归。但有时被解释变量是离散的,而非连续的。那么就要选择相应的离散选择模型进行分析。一、二值选择模型1.线性概率模型、logit与probit模型直接以案例进行讲解,以数据集womenwk.dta为例,估计决定美国妇女就业与否的二值选择模型。该数据集包括以下变量:work(是否就业),age            
                
         
            
            
            
            9.3使用数据集nerlove.dta,估计以下模型:其中,,,,与分别为电力企业的总成本、总产量、小时工资率、资本使用成本、燃料价格的对数。(1)使用稳健标准误,对方程进行OLS回归(2)计算VIF,是否存在多重共线性?(3)使用拟合值进行RESET检验,是否遗漏了非线性项?(4)在方程中加入lnq的平方项,重新进行回归(5)再次使用拟合值进行RESET检验,是否还遗漏了非线性项?(6)再次计算            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-13 20:16:42
                            
                                4251阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            R语言的再复习之路    1.OLS回归1.1 用lm()拟合回归模型格式myfit <- lm(Y ~ X1 + X2 + ... + Xk, data)符号用途~分隔符号,左边为相应变量,右边为解释变量。例如Y ~ X + Z + W+分隔预测变量:表示预测变量的交互项。例如Y ~ X + Z + X:Z*表示所有可能交互项的简洁方式。Y ~ X * Z * W即为Y            
                
         
            
            
            
            作者: 谢雁翔 (南开大学)目录1.简介2. R 的安装下载及 Rcall 命令的安装2.1 R 的安装下载2.2 Rcall 命令的安装3. Rcall 命令及 R 语言初识3.1 Rcall 命令基本语法3.2 R 语言基本的数据类型3.3 R 语言基本的数据结构4. Stata实例4.1 Stata 与 R 语言的数据转换4.2 在 Stata 中运行 R4.3 拓展:在 R 中运行St            
                
         
            
            
            
            一、简介混淆矩阵(Confuse Matrix)准确率(Accuracy)精确率(Precision)召回率(Recall)F1-ScoreROCAUCP-R曲线(Precision-Recall Curve)多分类sklearn分类评价指标的实现二、混淆矩阵TP(True Positives):实际为正例,预测为正例,预测对了。FN(False Negatives):实际为正例,预测为负例,预测            
                
         
            
            
            
            “对发送的内容要保守,对接收的内容要宽松” 
 这种明智的建议(也称为“稳健性原则”或Postel定律)在所有应用程序之间发送消息的用例中都非常有用。 通常,这些消息具有通过HTTP发送的Json有效负载。 典型的场景包括: 客户端在Json中序列化模型,然后通过HTTP将其发送到服务器。另一方面,服务器获取消息,提取请求的主体(即我们的Json),将其反序列化回模型(可以与客户端模型不同            
                
         
            
            
            
            最近看文献时,多数实验结果用到方差分析,但选的方法不同,主要有LSD,SNK-q,TukeyHSD法等,从百度广库里找了一篇文章,大概介绍这几种方法,具体公式不列了,软件都可以计算。这几种方法主要用于方差分析后,对均数间进行两两比较。均数间的两两比较根据研究设计的不同分为两种类型 : 一种常见于探索性研究,在研究设计阶段并不明确哪些组别之间的对比是更为关注的,也不明确哪些组别问的关系已有            
                
         
            
            
            
            1.回归的定义:找到一个函数,输出一个特征值,后输出数值。如:以过去房价数据预测未来的房价,李宏毅老师油管过去节目观看人数预测未来的最近节目观看人数。2.模型步骤: (1) 模型假设–线性模型:yi=xi*w+b 其中x为features,w为weight,b为bias;xi可以为多个feature. (2)模型评估–损失函数 在模型训练资料后得到了资料的分布,从数学的角度真实值y^到y轴的垂直函            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-09-06 18:52:51
                            
                                88阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            220127_202201_机器学习中一些模型评价指标简介目录220127_202201_机器学习中一些模型评价指标简介回归任务平均绝对误差(Mean Absolute Deviation)均方误差(Mean Square Error)均方根误差(Root Mean Squared Error)分类任务查准率 / 精度(Precision)召回率(Recall)F_β与F_1ROC曲线与AUC曲线            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-21 22:15:24
                            
                                200阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.1.16. Robustness regression: outliers and modeling errors稳健回归有点难,把它整理出来太花时间了,所以我决定转载一下我自己学习是看的一篇博客。老规矩,并非完全照搬,里面有内容结果上的调整和我自己的注释,希望大家有所收获。一、最小二乘法的弊端很多关于线性回归的模型,都是基于最小二乘法来实现的。但是,当数据样本点出现很多的异常点(outlie            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-18 12:46:28
                            
                                2283阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、分类算法的评估 1、二分类 ROC与AUC 1.1 roc曲线:接收者操作特征(receiveroperating characteristic) roc曲线上每个点反映着对同一信号刺激的感受性。横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specificity);纵轴:真正类率(true postive rate TPR)灵            
                
         
            
            
            
            很久之前的一篇文章,最近终于收到了Reviewers的回复(一把心酸…其中有一个Comments如下,意思是我们原先的文章没法证明共词聚类方法的结论是合理的…于是打算新增加一个稳健型检验(robust analysis),由于上次做这部分实在太久远了,这次用一个小样本将共词聚类分析的过程记录下来。Comments to the Author Overall, this manuscript nee            
                
         
            
            
            
            mat list 与matlist的区别:
matlist is an extension of the matrix list command。
mat list 只能打印一个完整的矩阵,而matlist则可以根据行列数或者行列名打印部分矩阵。
matlist  有更多的控制选项,可以更多地改变矩阵的展示方式。实例:. matlist result[1,1]
             |               
                
         
            
            
            
            # Python中的固定效应和稳健标准误
在统计学中,固定效应(fixed effects)和稳健标准误(robust standard errors)是两个重要的概念。固定效应用于面板数据(panel data)分析中,用于控制个体间的固定效应,从而减少估计量的偏误。稳健标准误则是一种对标准误进行修正的方法,使得模型更加鲁棒。
在Python中,我们可以使用一些库来进行固定效应模型的估计和稳            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-06-27 06:22:09
                            
                                465阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            实证小李-六步法(找数据,想机制,跑基准,稳健性,内生性,异质性) 本次要讲的是-稳健性检验-安慰剂检验通常用于did做实证分析时,其他虚拟政策对y是没有影响的,现在一般采用permute检验,这个命令可以省去很多代码量,具体的视频讲解请移步:https://www.bilibili.com/video/BV1kH4y177VM/spm_id_from=333.999.0.0&vd_sou            
                
         
            
            
            
            线性回归之误差分析首先回顾下上一节得到的曲线长这样: 图来源于李宏毅大神~error主要来源于两方面: bias:标准差 variance:方差简单的来理解一下bias(标准差)及variance(方差)比如:“预测宝可梦进化后的战斗力的例子”我们知道一定存在一个最佳的数学模型来预测新的“宝可梦”进化后战斗力,记为(这也是我们辛辛苦苦想找的)但是,我们每次实验结果得到最好的模型并非就是,我们记为那            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-26 22:38:15
                            
                                132阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            前几篇我们较为详细地介绍了K-means聚类法的实现方法和具体实战,这种方法虽然快速高效,是大规模数据聚类分析中首选的方法,但是它也有一些短板,比如在数据集中有脏数据时,由于其对每一个类的准则函数为平方误差,当样本数据中出现了不合理的极端值,会导致最终聚类结果产生一定的误差,而本篇将要介绍的K-medoids(中心点)聚类法在削弱异常值的影响上就有着其过人之处。与K-means算法类似,区别在于中            
                
         
            
            
            
             分支结构的分析要点 if-else循环结构的分析要点 do-while、while、for话不多说,让我们开始新的征程吧!您的点赞、评论、收藏将是对我最大的支持,感恩安全路上一路前行,如果有写得不好或侵权的地方,可以联系我删除。基础性文章,希望对您有所帮助,作者目的是与安全人共同进步,也强烈推荐大家去看看钱老师的视频,加油~ 文章目录一.C++逆向条件结构基础入门1.单分支结构分析2.            
                
         
            
            
            
            一、为什么?对样本做回归分析的核心是使用最小二乘法去估计模型里的参数,比如核心解释变量前面的系数。我们通过最小二乘法使得残差平方和最小,求得样本估计系数。如果进行一次估计,由于干扰项e的存在,估计值与真实值之间一定存在差异。样本估计值与真实值之间的差别中,误差项起了关键作用。误差项是一个随机变量,每次估计都会得到不同的差异值。关于样本估计系数性质的讨论,都以误差项为核心。我们希望样本估计系数特别好            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-20 08:41:49
                            
                                339阅读
                            
                                                                             
                 
                
                                
                    