生存预测模型样本量计算(完善中)

预测模型的样本量计算一直都是困扰笔者很久的问题
一般临床预测模型常见的有两类:非时间因素/包含时间因素
举例来说,非时间因素建模常见于logistic/lasso等回归模型之后,时间因素相关的结局变量常见于cox等模型建模后。
如果选用logistic模型,可使用的思路为:
1、根据自变量数目进行预测,根据自变量(即构建模型的自变量)数量,10-20倍区间的样本量均可。具体理论后续补充或完善。
2、将预测模型视为临床研究的思路,即A模型比B模型能提高结局的预测能力,即在某一类人群中(高危?or 低危?)模型的预测准确度提高了多少。即ROC提高了多少,通过软件ROC可以计算。计算方法 PASS软件可以实现,需强调的是,需要输入阳性与阴性事件发生的概率比值。
包含时间因素:例如cox等,本身似乎并不存在相应的计算方式,所以不要有太高的指望。有的话请统计大佬不吝赐教。
考虑到实际应用的问题,将时间因素降维到时间节点后有退化的方式
包括
1、特殊事件点的事件预测能力,将时间退化到时间节点后预测ROC的提高程度。
eg 患者活到3年的概率为(3年OS率),如果从10%提高到20%,需要的样本量是多少,将预测模型作为一个干预变量进行设计。