Python 记录文件操作:os.mknod("test.txt")        创建空文件
fp = open("test.txt",w)     直接打开一个文件,如果文件不存在则创建文件
关于open 模式:
w     以写方式打开,
a     以追加模式打开 (从 EOF 开始, 必要时创建新文件)
r+     以读写模式打开
w+     以读写模式打开 (参见 w )
a+            
                
         
            
            
            
            显著性检验可以告诉我们某个观测值是否有效,,例如检测两组样本均值差异的假设检验可以告诉我们这两组样本的均值是否相等。由于一些因素的限制,我们一般得到的样本都是小样本,而我们想知道总体样本的分布,这时就需要置换检验。下面通过一个简单例子来介绍Permutation test的思想。       假设我们设计了一个实验来验证加入某种生长素后拟            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-19 08:28:39
                            
                                97阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            假设检验可以建立批判思维,切忌盲目追寻他人的观点。在各个领域都应用广泛,例如犯罪学,科学研究中都会假设某个推理,然后通过一系列结论去证明这个推断是否成立,如果成立则接受假设,若不成立则接受反面推断。 
    
  假设检验的四个步骤 
    
  一、问题是什么 
    
  1.明确问题是什么,根据问题假定两个假设:零假设和备选假设,两个假设是对立的。零假设总是表述为研究没有改变,            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-05 04:11:15
                            
                                26阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # 使用Python实现AD检验(Anderson-Darling Test)
在统计学中,检验一个样本是否来自一个特定的分布是很重要的。Anderson-Darling检验(AD检验)是一种常用的方法,主要用于检验样本数据是否符合正态分布。本文将介绍如何使用Python实现AD检验,并给出相应的代码示例。
## 什么是Anderson-Darling检验?
AD检验的基本思路是比较样本数据            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-10-10 06:01:59
                            
                                266阅读
                            
                                                                             
                 
                
                             
         
            
            
            
                   正态分布广泛存在于自然现象、生产、生活的方方面面,例如试卷命题难度,产品的使用寿命、农作物产量、气温、降水量、工资收入、人类的身高体重肺活量,甚至颜值……关于正态分布的数学定义及各种性质,不在此赘述。简单理解,就是“两头小,中间大”,比如长相奇丑无比和倾国倾城的人都是少数,绝大多数人都属于大众脸。很多时候,在进行数据分析工作时,首先要看的就是数据是服从何种概率分布,而正态分布则是最重            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-09-15 17:19:59
                            
                                89阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            统计假设检验有很多,从大的方面包括参数检验与非参数检验。参数检验有我们常见的关于方程模型显著性检验的F检验,方程参数的T检验等;而非参数检验中比较常见的则包括符号检验、秩和检验以及游程检验。提到参数检验时,不得不说的一个概念就是P-值,也就是SAS&SPSS等统计软件输出结果中的做sig.值,到底什么是sig.值是什么,它与我们平时所熟悉的概率P有什么关系,最初它是怎样形成的……提            
                
         
            
            
            
            # Python实现F检验
## 引言
F检验是一种用于比较两个或多个样本方差是否有显著差异的统计方法。它基于两个独立样本的方差比值构建了一个统计量,并与理论上的F分布进行比较来确定差异的显著性。在统计学和数据分析领域,F检验是一种常见的方法,用于比较实验组和对照组之间的差异是否显著。
本文将介绍F检验的基本原理、应用场景以及如何使用Python实现F检验。
## F检验的原理
F检验的            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-08-30 11:13:00
                            
                                743阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            使用Python实现MK检验的复盘记录
在数据分析和统计中,MK检验(Mann-Kendall检验)是一种常用的无参数检验方法,用于检测时间序列中的趋势。随着数据科学的发展,对MK检验的需求逐渐增多。本文记录了使用Python实现MK检验的整个过程,并详细阐述相关的技术原理、架构以及应用场景。
```markdown
### 背景描述
自2020年以来,随着大数据时代的到来,越来越多的行业开            
                
         
            
            
            
            # 使用Python实现DM检验的完整指南
## 引言
DM(Diebold-Mariano)检验是一种用于比较两个预测模型的有效性的方法。在金融、经济和机器学习等多个领域,DM检验帮助研究人员评估不同模型的相对性能。对于刚入行的小白开发者,理解并实现DM检验的方法可能会有些困难。本文将通过详细的步骤和代码示例,带领你掌握DM检验的实现过程。
## 流程概述
在开始之前,我们先把整个实现过            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-09-14 04:45:53
                            
                                1050阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            回到回归的正题,回归问题是机器学习领域中应用的比较广的一种方法,不过我觉得大部分的回归模型都是广义线性模型,在Andrew NG的课程中,对广义线性模型做了比较详细的推导,这篇文章的内容是,线性回归、局部加权回归、岭回归以及前向逐步回归,除了前向逐步回归之外,其他的都是广义线性回归模型,基本思路都是 1,确定损失函数 2,使用梯度下降(或者梯度上升)求解权重参数,算是套路,而这两种套路使用Pyth            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-24 14:22:40
                            
                                23阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            SPSS 25 是一个集成的系列产品,解决了整个分析过程,从策划到数据收集,分析,报告和部署。随着十几完全集成的模块可供选择,你可以找到你需要的专业能力,以增加收入,超越竞争对手,进行研究,并做出更好的决策。包括贝叶斯统计,新的图表构建器,客户请求的统计增强功能等,可以更好的应用高级统计分析,解决最棘手的业务问题,帮助用户快速轻松从数据中获取新洞察。        SPSS 25 提供了大量专业统            
                
         
            
            
            
            使用Python进行简单的常用的假设检验,主要有数据正态性检验、独立两样本t检验、单因素方差分析、相关性检验。 P:拒绝原假设(H0)时犯错误的可能性,这个P值很小(P<0.05代表P很小),则可以认为原假设时错误的。1.K-S检验 用来判断一组数据是否服从正态分布 使用Scipy库中的stats模块K-S检验Kolmogorov-Smirnov检验它是检验单一样本是否来自某一特定分布的方法            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-12 08:49:32
                            
                                234阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            注:终于写到最激动人心的部分了。假设检验应该是统计学中应用最广泛的数据分析方法,其中像"P值"、"t检验"、"F检验"这些如雷贯耳的名词都来自假设检验这一部分。我自己刚开进入生物信息学领域,用的最多的就是"利用t检验来判断某个基因在实验组和对照组中表达量的差异是否显著"。此外,对"P值"真正含义的探究也开启了自学概率论与数理统计之路。因此无论是应用价值,还是对我学习统计学的影响,这部分的内容都是意            
                
         
            
            
            
            量化金融–假设检验3-分类数据的检验 分类型数据的常用检验方法量化金融--假设检验3-分类数据的检验分类型数据的介绍常用的检验方法卡方检验、Fisher检验方法的分析原理介绍卡方检验Fisher检验 分类型数据的介绍分类型数据也称为频数数据。在数据样本中,我们称落入某一个特定分组的样本数量为频数;当分组的维度只有1时,我们称这样的数据为单因素频数表;当分组的维度为2时,我们称这样的数据为列联表数据            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-17 18:30:45
                            
                                113阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            这几天在一个项目上需要用到K均值聚类算法,以前都是直接利用百度老师copy一个Kmeans算法代码,这次想自己利用已知的算法思想编写一下,编写才知道,虽然熟悉了算法思想,真正实现时,还是遇到不少bug,这就是小学老师说的"眼高手低",还是需要亲自动手实现一下,才算真正的掌握思想。回顾一下Kmeas算法思想,将若干元素聚为k类,使之,每一类内的元素相似度较高,类间的元素相似度较低,达到将若干元素划分            
                
         
            
            
            
            临床研究中,存在这样一类研究,我们关注的临床结局是一个事件,比如:死亡,复发,症状消失,疾病痊愈等等。在很多情况下,我们不仅关注事件是否发生,还会关注事件发生的早晚。同时,由于研究周期的限定,和患者依从性的差异,是我们不可能追踪到所有结局事件的发生。面对这样的数据该如何统计分析呢?办法当然有,由于最初这类方法被应用于针对死亡结局的分析中,所以这类分析被称为:生存分析。其中,Kaplan-Meier            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-05 20:54:25
                            
                                125阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            rank 39 mark 140T2:概率期望T2:你在k维的坐标系中,从(1,1,...)到(n1,n2,n2...),每次你有p的概率逼近终点一步,(1-p)的概率回退到走到当前位置的上一个状态,求走到终点的步数期望.(n<=1e5)(1)显然倒退的话dp[i]:从i到终点的期望时间dp[i]=dp[i-1](1-p)+dp[i+1]p+1.(显然和维度没有关系对吧)发现i和前后都有关系            
                
         
            
            
            
            一、快速理解我开始学习假设检验时遇到了几个问题:什么是假设检验?为什么要假设检验?什么是假设:对总体参数(均值,比例等)的具体数值所作的陈述。(因为一般来说总体的属性具体值我们是测不出来的,也只是靠不停的测试逼近具体值,所以只能假设总体的某一个属性的具体值为xxx)而假设检验就是先对总体的参数提出某种假设,然后利用样本的信息判断假设是否成立的过程。样本值是变化的,通过样本值计算出来的样本参数不一定            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-21 09:57:05
                            
                                95阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # 随机游走检验及其Python实现
## 引言
随机游走是一种经典的数学模型,用于描述在离散的空间中随机移动的行为。它在各个领域都有广泛的应用,如金融学、物理学、生态学等。随机游走检验是用于检验时间序列是否具有随机游走性质的统计方法,它能够帮助我们判断一个数据序列是否具有趋势性。
在本文中,我们将介绍随机游走检验的概念和原理,并使用Python编程语言实现一个简单的随机游走检验算法。
#            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-11-01 09:36:38
                            
                                112阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # Python实现白噪声检验
白噪声是指均匀分布在频域上的随机信号,其各个频率成分的能量相同。在信号处理、时间序列分析等领域,白噪声是一个重要的概念。检验一个时间序列是否为白噪声,可以使用几种统计测试方法,如自相关函数(ACF)和Ljung-Box检验等。本文将介绍如何使用Python实现白噪声检验,并给出示例代码。
## 白噪声特征
白噪声具有以下特征:
1. 均值为零:随机信号在长时间