1. 生存分析生存分析主要用于医学研究,比如医疗方案对病人寿命的影响。后面用来探究所感兴趣的事件的发生的时间的统计方法。比如产品的寿命分析、工程中的失败时间分析等等。这里病人死亡、产品淘汰和工程失败等称为事件event。生存分析中有两个重要的概念,一是生存函数,二是风险函数。生存函数的形式如下,表示为事件未发生的样本比例随时间变化的趋势,比如存活病人样本比例、可正常使用产品比例随时间的变
生存分析(Survival Analysis)、Cox风险比例回归模型(Cox proportional hazards model)及C-index1. 生存分析生存分析指的是一系列用来探究所感兴趣的事件的发生的时间的统计方法。常见的有1)癌症患者生存时间分析2)工程中的失败时间分析等等。1.1 定义给定一个实例 ,我们用一个三元组来表示 ,其中表示该实例的特征向量,表示该实例的事件发生时间。如
box-cox        由于线性回归是基于正态分布的前提假设,所以对其进行统计分析时,需经过数据的转换,使得数据符合正态分布。        Box 和 Cox在1964年提出的Box-Cox变换可使线性回归模型满足线性性、独立性、方差齐性以及正态性的同时,又不丢失信息。    &n
知识点进程和线程:进程和线程都是一个时间段的描述,是CPU工作时间段的描述,不过是颗粒大小不同.进程就是包换上下文切换的程序执行时间总和 = CPU加载上下文+CPU执行+CPU保存上下文.线程是共享了进程的上下文环境的更为细小的CPU时间段。判别式模型和生成式模型:判别式模型直接学习决策函数f(X)或条件概率分布P(Y|X)作为预测的模型.往往准确率更高,并且可以简化学习问题.如k近邻法/感知机
1 基本概念1.1 生存数据生存数据就是关于某个体生存时间的数据。生存时间就是死亡时间减去出生时间。例如,以一个自然人的出生为“出生”,死亡为“死亡”。 那么,死亡时间减去出生时间,就是一个人的寿命,这是一个典型的生存数据。类似的例子,还可以举出很多。所有这些数据都有一个共同的特点, 就是需要清晰定义的:出生和死亡 。如果用死亡时间减去出生时间,就产生了一个生存数据。因为死亡一定发生在出
# 无序多分类变量在Cox回归中的应用与解读 Cox回归模型(Cox Proportional Hazards Model)是一种广泛应用于生存分析的方法,能够探究多个自变量(包括分类变量和连续变量)对事件发生时间的影响。在实际应用中,研究人员常常面临无序多分类变量的挑战。本文将介绍如何在R语言中进行Cox回归分析,并解读结果,重点关注无序多分类变量的处理。 ## 1. 什么是无序多分类变量?
原创 2024-09-03 06:47:20
755阅读
李宏毅课程笔记1Regression提出问题建立模型梯度下降Regularization(正则化)Basic Concept(基本概念)重点备忘 本次笔记主要包含两节课:Regression(回归)和Basic Concept(基本概念) Regression提出问题本节课李宏毅老师是以宝可梦升级后的CP值预测作为学习目标的。(这个思路非常好,用一个有趣的又容易实现的任务作为学习目标,完成目标的
复习总结关于logistic回归的相关原理及实现:简单来讲,Logistic回归主要是用在二分类方面的问题,用于估计某种事物的可能性。比如,用户买不买某件商品的可能性;某广告被用户点击的可能性;但是,这里的可能性并非是指概率,logistic回归结果并不是数学上的概率值,不可以直接当做概率来用。一般来讲,logistic回归得到的结果都是与其他的特征值加权求和,而不是直接相乘。Logistic回
背景与原理:线性回归可以实现对连续结果的预测,但是现实生活中我们常见的另一种问题是分类问题,尤其是二分类问题,在这种情况下使用线性回归就不太合适了,我们实际上需要计算出的是一个在$[0,1]$之间的概率来告诉我们某样本属于某一类的概率,因此逻辑回归应运而生。一般的逻辑回归就是在线性回归的基础上嵌套一个逻辑函数,把线性回归结果转换成概率。即我们定义$h_{\theta}(X)=P(y=1|X,\t
转载 2022-03-27 16:50:00
190阅读
逻辑回归原理详解逻辑回归主要用于解决分类问题,并且是对于概率的分类,例如今天是雨天还是晴天,是雨天就是0概率,是晴天就是1概率。通常我们预测出的情况是今天是晴天的概率值。谈及逻辑回归的原理,需要先从广义线性回归(GLM)讲起:广义线性回归(GLM)广义线性回归满足以下的三个条件:对于参数,y|x满足指数族分布,为充分统计量,对于预测值指数族分布被称为自然参数被称为充分统计量,常用的是被称为对割函数
《Interpretable Machine Learning》(https://christophm.github.io/interpretable-ml-book/index.html)内容围绕:对于一个训练好的线性模型,怎样去向模型使用者(客户)解释这个模型(参数含义、为什么得会得出这种预测结果)。 上图为一个线性回归的单个实例,最后一项为误差。1. 模型是否“正确”,需要用到的数据间遵循一
1、COX回归模型: h(t/X)=h0(t) exp (β1 X1 + β2 X2 + …… + βp Xp ) h0(t): 基准风险函数 即所有变量取零时的t时刻的风险函数 X1、X2 …… Xp:影响因素 变量 β1、β2 …… βp:回归系数 2、监督学习与无监督学习 监督学习,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型
转载 2024-03-20 20:12:35
22阅读
上次介绍了生存分析中的寿命表、K-M曲线、logrank检验、最佳切点的寻找等,本次主要介绍Cox回归。本推文不涉及理论,只有实操,想要了解生存分析的理论的请自行学习。Cox回归使用survival包中的lung数据集用于演示,这是一份关于肺癌患者的生存数据。time是生存时间,以天为单位,status是生存状态,1代表删失,2代表死亡。rm(list = ls()) library(surviv
生存分析中,探究生存时间的影响因素是一个重要的研究内容,通过KM和log-rank test检验的方法,只能够处理单个二分类因素的生存数据。当想探究多个因素或者离散型变量对生存时间的影响时,我们就需要借助于cox回归方法。cox回归的全称如下cox proportional hazards regression model称之为cox等比例风险回归模型, 对应的公式如下将上述公式进行log转换,
推荐系统的排序算法-线性模型1. 逻辑回归1.1 逻辑回归算法1.2 逻辑回归算法实现2. 因子分解机FM2.1 FM算法2.1.1 FM模型2.1.2 FFM模型2.1.3 FM模型的网络结构2.2 FM实现 推荐系统的排序算法,就是根据用户和物品的所有标签特征,通过排序模型计算,得到用户对候选物品集的评分。其中,在排序模块中使用的特征比召回模块中的复杂,目的是计算用户精确的预测值。工业界最常
( 一 )Matlab1.数值计算和符号计算功能Matlab   以矩阵作为数据操作的基本单位,它的指令表达式与数学、工程中 常用的符号、表达式十分相似,故用Matlab 来解算问题要比用C、FORTRAN 等 语 言完成相同的事情简捷得多,使学者易于学习和掌握。Matlab   还可以提供非常丰富的数值计算函数,而且采用的都是国际通用的数值计算算法,便捷通
在计量经济学中,对于政策评价的基本方法一般有三种:合成控制法,双重差分法(DID),断点回归。其中合成控制法和双重差分法十分相似,本质思想在于,找到一个对照组,对比处理组与对照组的异同,得出政策的效果评价。在实验室中进行的实验,例如,生物细菌培养,实验基本条件是可控的,可以通过人为改变外在条件,达到对处理组和对照组的不同处理效果。但是对于地区政策评价时,找到一个地区的对照组是比较困难的。因为一旦对
PLS入门: 1,两篇关键文章 [1] de Jong, S. "SIMPLS: An Alternative Approach to Partial Least Squares Regression." Chemometrics and Intelligent Laboratory Systems. Vol. 18, 1993, pp. 251–263.  [2] Rosipal,
转载 2023-11-06 16:23:05
240阅读
1.GMM(guassian mixture model)  混合高斯模型,顾名思义,就是用多个带有权重的高斯密度函数来描述数据的分布情况。理论上来说,高斯分量越多,极值点越多,混合高斯密度函数可以逼近任意概率密度函数,刻画模型越精确,需要的训练数据也就越多。2.GMM模型初始化:  即模型参数的初始化,一般采用kmeans或者LBG算法。模型初始化值对模型后期的收敛有极大影响,特别是训练模型的数
转载 2023-07-03 17:44:14
628阅读
上期咱们已经介绍了咱们绘制复杂抽样设计数据的基础图形,今天咱们来介绍一下咱们绘制复杂抽样设计cox回归生存曲线(Kaplan-Meier)。 废话不多说咱们先导入数据和R包library(survey) pbc<-read.csv("E:/r/test/pbc.csv",sep=',',header=TRUE) 这是一个原发性胆道胆管炎数据,公众号回复:胆管炎数据,可以获得数据,嫌麻烦的也可
转载 2024-02-02 08:07:07
282阅读
  • 1
  • 2
  • 3
  • 4
  • 5