红色中国网

 找回密码
 立即注册
搜索
红色中国网 首 页 经 济 查看内容

新冠肺炎患者数量增长模型分析

2020-5-13 01:22| 发布者: redchina| 查看: 32892| 评论: 2|原作者: 壮壮

摘要: 2020年3月后半段以来,红色中国网上每天都发表“远航一号”关于新冠肺炎疫情的文章:自3月20日起,笔者每日根据世界卫生组织提供的全球新冠病毒疫情形势报告做一些简单统计分析,帮助各位网友追踪全球疫情发展动态。他的研究过程很不严密,很可能导致明显错误的结论。

舍弃10%5%(为什么不是8%6%4%呢?)以上的样本这类做法,完全是跟在事实后面跑,没有科学研究所应有的规律性和预见性,每次调整后最终患者数量都会明显增加,结果非不稳定。

考虑最近十几天的情况,按照“远航一号”选取样本的标准,完全可以舍弃新增病例与累计病例之比在4%以上的样本,这时积累样本的时间明显长于新冠肺炎的潜伏期——比“远航一号”以前的做法还合情理。可以预见,利用这些样本计算出的最终患者数量要明显多于近期超过500万的预测结果[3],选择样本方法不当导致最终患者数量的预测结果受研究者的主观意识影响很大。

不过,“远航一号”的研究中最严重的问题是在迭代时把回归分析得到的关系式用在不适用的时间段里。

比如53[3]的文章,用到了20天的材料,最后一天是52日,模型能预测的时间不会比建立模型涉及的时间更长,所以这篇文章建立的模型最多只能预测到522日的情况。由于计算增长率以后只有19对数据,且拟合结果可靠性不算高:相关系数r的绝对值在0.90左右,偏差会在多次迭代中放大,实际有效时间肯定短于20天。总之,五月下旬就是模型所能预测的最远未来。

或许可以尝试再多预测几天,但进入6月中旬模型应该就不会适用了。但文章中却说“按照现在的趋势,预计全球疫情将于今年7月份趋于稳定 [3],预测疫情稳定的时间超出模型适用范围太多了,笔者觉得很可能不准确。

理论上,“远航一号”预测疫情稳定时间的方法很不严密。不过,近期世界范围内疫情还在比较快地发展,57-8日单日患者增量还达到新高超过9.5[2],要想在短期内通过事实否定或证明“远航一号”的结论是不可能的。

在世界各大分区中,近期只有中国疫情大体上趋于稳定——虽然还有小波折。“远航一号”曾几次预测“中国(含港澳台)”的“最终累计病例数量”, 最近一次的结果是:“219日至322日间新增病例与累计病例之比的统计分析表明,中国最终累计病例将达到81803例。[9](需翻墙)几天以后,事实就证明了他的预测结果很不可靠:根据世界卫生组织的报告[2]326日中国(含港澳台)新冠肺炎累计确诊病例达到81848例,超过了“远航一号”的预测结果。到58日,中国(含港澳台)累计确诊病例达到84415[2],比“远航一号” 的预测结果多出2612例。

可能有人会觉得:相对而言,事实与“远航一号”的预测结果偏差并不大。但科学的预测看的应该是增量而不是总量。323日中国(含港澳台)累计确诊病例为81601[2]。根据“远航一号”的预测结果,病例最终只能再增长202例,但截至58日实际增量已经达到了2814例,约为预测增量的14倍。预测偏差实在太大,让人无法接受。即便刨除境外输入病例(不会超过1700[10]),本土病例增量也超过1100例,约为预测结果的5.5倍,预测偏差还是让人无法接受。

 “远航一号” 做出预测时中国疫情已趋于缓和,考虑到这一情况,就越发让人觉得他建立的模型和采用的方法靠不住:对于疫情比较稳定的地区都不适用,对于整体上疫情仍在快速发展的全世界又怎能适用呢?

需要对预测结果进行修正。根据世界卫生组织的报告[2]52日全世界新冠肺炎累计确诊病例约为327万例,而“远航一号”的预测是“全球除中国以外地区累计病例最终将达到约507万例 [3],考虑到中国的8万多患者,“远航一号”的计算结果意味着确诊病例还要增加约190万。根据前面对中国情况的分析可知:实际增量将超过预测增量的5倍,所以笔者觉得实际增量应该能达到1000万,这意味着最终确诊病例至少也在1300~1400万例之间。

这是个比较高的估计,比“远航一号”最近调整样本后的预测结果“全球除中国以外地区累计病例最终将达到约883万例(回归R平方值0.265[11](需翻墙)还要高出很多,且估计中有很多猜测成分,准确度有可能不够。

不过,“远航一号”调整样本后的最新估计结果笔者是肯定不认同的。最新的文章利用的是“根据427日至511日之间的数据得到的线性回归趋势[11],涉及15天的时间,不短于新冠肺炎的潜伏期,没有样本过少的问题。但文章对样本的舍弃还是显得比较随意:“改用新增病例与累计病例之比小于3%的数据作为样本[11],仅仅是计数考量而没有讲和疾病本身有关的考虑。

最严重的问题依然是在迭代时把回归分析得到的关系式用在不适用的时间段里:“按照现在的趋势,预计全球疫情要到今年9月份才能趋于稳定[11]。最后的数据是511日的情况,再过15天也没到6月,考虑到相关系数的绝对值比较小(0.5左右),回归分析结果到5月末应该就不适用了,哪里还能预测到9月份的情况?超出适用范围的问题更加明显了。

希望以后“远航一号”在建立新冠肺炎患者数量增长模型的时候注意笔者提到的问题。

 

作者:壮壮                             日期:202051-12


鲜花
1

握手

雷人
1

路过

鸡蛋

刚表态过的朋友 (2 人)

发表评论

最新评论

引用 sxm 2020-5-16 00:52
请问“模型能预测的时间不会比建立模型涉及的时间更长”是从何而来,我好像没听过这个说法。。。只知道预测越远误差越大
引用 水边 2020-5-13 03:04
建议这个朋友可以把精力做一些别的分析工作,而不是执着的拿10几个样本猜测一阶线性方程。完全是凑数据的,这怎么可能是什么理论上”可靠“的东西?你说远航一号的尝试不可靠,但是自己拿出来的东西还离远航的分析差得远。
如果真要研究”可靠“理论模型,你起码得从流行病学的传染模型开始吧。

查看全部评论(2)

Archiver|红色中国网

GMT+8, 2024-4-24 22:10 , Processed in 0.065561 second(s), 12 queries .

E_mail: redchinacn@gmail.com

2010-2011http://redchinacn.net

回顶部