红色中国网

 找回密码
 立即注册
搜索
搜索
红色中国网 首 页 查看评论
引用 陕青1988 2020-4-7 00:42
就以往传染病流行的经验来看,每日新增患者的数量在爆发前期是增加的,在得到初步控制的时期(即所谓“拐点”)是基本恒定的,在已经得到控制的时期是减少的。因此,以累计患者总数为纵轴,以日期为横轴,曲线应当呈现类似于斜体积分号的形状,即斜率先增加,再恒定,在减少,最后归零。壮壮的所有回归公式都无法反映斜率先上升后下降的规律。
统计学是服务于预测现实情况的,如果统计模型设计与现实无关,为回归而回归,那么无论相关性如何都是伪回归。
引用 陕青1988 2020-4-7 00:40
就我有限的统计学经验来看,壮壮网友的分析反而不如远航一号原有的分析。理由如下。
在壮壮最初反驳远航一号的文章中,他(我估计壮壮网友是男性)提到“你采用的是患者总数的增长率和日期这两个变量”进行拟合。这显然看走眼了,远航一号采用的是当日患者增长人数占累计患者总数比例和累计患者总数进行拟合。这两个变量在疫情进入爆发期之后是可能存在稳定的负向线性关系的(这一点正在逐渐被事实所验证)。
壮壮网友自己的分析是累积患者总数和日期的关系。壮壮选出了两个相关程度最高的回归(乘方和指数)按照壮壮得出的b值,这两者的斜率都是不断上升的,即新冠病毒每天会以一个越来越高的增长率不断扩散并且最终感染世界上所有人。这与基本已经控制住疫情的中国经验不符,也和韩国、意大利等国的数据不符。
引用 水边 2020-4-5 11:28
不是我打击作者,我还是头一次见到有人说回归分析有11个观测值就够了,样板太小,基本没有任何意义。简单的最小二乘法回归,不报告R平方,更是没啥能评论的。这个模型更是让人无语。
远航一号的统计模型,看的是总量和增长率的关系,统计方法非常直接,但是目前看来线性关系还是能解释相当一部分变化的,这样的研究不是最严密的,但是能提供有价值的信息。
引用 redchina 2020-4-5 06:29
壮壮网友发来了他自己的统计分析。有兴趣的读者可以将其与远航一号的分析做比较,并展开进一步的讨论。

Archiver|红色中国网

GMT+8, 2024-3-29 19:02 , Processed in 0.007032 second(s), 5 queries .

E_mail: redchinacn@gmail.com

2010-2011http://redchinacn.net

回顶部