生存分析法中的数据是横截面数据分析吗

【图文】医学统计:生存分析_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
医学统计:生存分析
上传于|0|0|暂无简介
大小:1.57MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢关注今日:12 | 主题:109124
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
如何从GEO提取出生存分析的数据?
页码直达:
比如我有一个GSE50081这个数据集,下载下来的soft以及series matrix里面的信息太多了,我如何快速找到有用的生存数据呢?请问R有没有类似的包呢?
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
我昨天晚上也一直在研究这个额问题,想把GSE数据里面的GPL弄出来,但是就是不会
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
都不知道咋下载这些数据,在什么软件下进行工作整理。。。。。。刚接触,一头浆糊啊。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
这要到文章里去找吧。geo的数据一般就是芯片表达值而已。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园[转载]生存分析(Survival&Analysis)--数据挖掘
&&&什么是生存?生存的意义很广泛,它可以指人或动物的存活(相对于死亡),可以是患者的病情正处于缓解状态(相对于再次复发或恶化),还可以是某个系统或产品正常工作(相对于失效或故障),甚至可是是客户的流失与否等。下面是几个生存分析的几个基本概念:
&& ●生存时间&
广义的生存时间指从某个起始事件开始,到某个终点事件的发生所经历的时间,也称为失效时间(failure time)。
&&&根据研究对象的结局,生存时间数据可分为如下两种类型:
&&&★完全数据(complete
data):观察对象在观察期内出现响应(终点事件),这时记录到的时间信息是完整的。
&& ★截尾数据(截尾值、删失数据,censored
data):尚未观察到研究对象出现响应(终点事件)时,即由于某种原因停止了随访,这时记录的时间信息是不完整的,常在数据的右上角以符号“+”标识。
& ●死亡概率q:在某时间区间内的被观察对象在该时间区间内(无失访)死亡的概率估计
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
●生存概率p:在某时间区间内(无失访)的被观察对象在该时间区间内生存的概率估计
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
●生存函数分为两种情况如下:&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
& ①若前 个时段没有删失:
②若观察期内有删失:假定观察对象在各个单位时段内是否生存的事件是相互独立的,其生存概率分别为
& 则根据概率乘法原理得
&& 故生存函数又称累积生存概率(cumulative
probabilityof survival),即将时刻t尚存活看成是前 个时段一直存活的累计结果。
& ●生存率曲线(survival curve):
&&是指以时间为横轴、生存率为纵轴,将各个时点的生存率连接在一起的曲线图。曲线形状分为两种:
& 1、阶梯形:小样本资料用直接法估计的生存曲线;
& 2、折线形:大样本资料用频数表法估计的生存曲线。
& ●中位生存期(median survival time):
也称半数生存期,即生存时间的中位数,表示生存率等于50%时的时间。反映生存时间的平均水平。
●危险率函数是生存分析的基本函数,它反映研究对象在某时点的死亡风险大小。生存函数与危险率函数的关系可表示为:
& 生存分析的主要研究内容包括三个方面:
& ●对生存状况进行统计描述,例如生存概率、生存率、中位生存期等。
& ●寻找影响生存时间的“危险因素”和“保护因素”。
& ●估计生存率和生存时间的长短,进行预后估计分析。
&&生存分析被广泛地运用在医学、工业研究、社会科学、生物学等,生存分析的常用方法有:非参数法、参数法、半参数法。
●非参数法:其特点是不论资料是什么样的分布形式,只根据样本提供的顺序统计量对生存率进行评估,包括乘积极限法和寿命表法
●参数法:其特点是假设生存时间服从于特定的分布,并根据已知分布的特点对观测样本的生存时间进行分析,包括指数分布法、Weilbull分布法、对数正态回归分析法和对数logistic回归分析法等
●半参数法:兼非参数和参数法的特点,主要用来研究影响生存时间和生存率的因素,属于因素分析法,典型方法为Cox模型分析法。
下面就重点讲一下Cox回归模型。Cox模型是生存分析中一个很重要的内容,就是探索影响生存时间(生存率)的危险因素,这些因素通过影响各个时刻的死亡风险(危险率)来影响生存率。由英国统计学家D.R.Cox于1972年提出,主要用于肿瘤或其他慢性疾病的预后分析,发展到目前为止,已不仅局限于此,而是被广泛地应用各个领域。其优点包括:是使用于多因素的分析方法、不考虑生存时间的分布形状、能够有效地利用截尾数据。&&
COX回归用于研究各种因素(称为协变量,或伴随变量等)对于生存期长短的关系,进行多因素分析。
&&h(t,x)=h0(t)exp(b1x1 + b2x2 +&&&&&&+ bmxm
X1,X2,&&&&,Xm是协变量
,b2,&&&&&&,bm是回归系数,由样本估计而得。
&&bI &0表示该协变量是危险因素,越大使生存时间越短
&&bI &0表示该协变量是保护因素,越大使生存时间越长
h(t,x)=h0(t)exp(b1x1 + b2x2 +&&&&&&+ bmxm
&&h0(t)为基础风险函数,它是全部协变量X1,X2,&&&&,Xm都为0或标准状态下的风险函数,一般没有明确的定义和假设的分布。
&&&h(t,x)表示当各协变量值X固定时的风险函数,它和h0(t)成比例,所以该模型又称为比例风险模型(proportional& hazard& model)
这里再介绍一下三个假设检验:似然比检验(likelihood ratio
test),可用于模型中原有不显著变量的剔除和新变量的引入,以及包括不同变量的各模型的比较;得分检验(score
test)可用于检验一个或多个新变量能否引入模型,也可用于检验变量间的交互作用是否显著;Wald检验,用于检验模型中的变量是否被剔除。
&&接下来我分别从Clementine和spss软件来讲解如何实现生存分析。数据源是软件自带的telco.sav。
(1)Clementine:
首先把加入一个spss数据节点,导入数据telco.sav。以下是建模截图:
然后选择Cox回归模型建模,生存时间按选择tenure
模型方法选择逐步法
在专家里收敛默认,以下是输出设置。:
步进标准选择似然比,相应的参数如下:
执行,生成模型后,可以浏览查看各个输出结果,在这里就不在多解释了。然后把模型加入到流当中。右键点击编辑,选中时间字段并选择tenure作为时间段,确定选中追加所有概率,然后确定。
再在图形字段里找到评估字节,加入流当中,一下是设置:
执行结果增益的评估输出:
从图中可以看出百分位60的增益可以达到80,感觉还不错。
下面我再利用排序对cp-1-1降序排序,并用table输出。查看并可以确定相应的截断值。如果想对以后的时间段做预测,只要在原来的模型中选中规则区间并设置参数,还有选中过去时间段。
(2)SPSS的Cox回归模型
首先导入telco.sav数据,在选择分析--生存函数--Cox回归,
下面是Cox设置,选择时间,定义事件,并把相应的协变量选入,方法选择向前:LR。
从上面的截图可以看出还有四个按钮需要设置:分类、绘图、保存及选项。
点击确定也会得到相应的结果。
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。扫二维码下载作业帮
2亿学生的选择
下载作业帮安装包
扫二维码下载作业帮
2亿学生的选择
时间序列数据与横截面数据有什么区别?
清枫嗕椙砶
扫二维码下载作业帮
2亿学生的选择
满意答案˙五迷三道’7级时间序列数据和横截面数据,对某个统计指数在不同时期进行观测,将得到的数据按时间先后次序进行排列,这样得到的统计数据称为时间序列数据.每月的销售额、每季度的进口额、每年末的存款余额等都是时间序列数据.与此不同,若某个指标在不同的个体上进行观测,则得到该指标的一组横截面数据.
为您推荐:
其他类似问题
扫描下载二维码【图文】生存分析_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
上传于|0|0|暂无简介
大小:357.00KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢

我要回帖

更多关于 截面数据统计分析方法 的文章

 

随机推荐