红色中国网

 找回密码
 立即注册
红色中国网 首页 经 济 查看内容

新冠肺炎患者数量增长模型分析

2020-5-13 01:22| 发布者: redchina| 查看: 5789| 评论: 2|原作者: 壮壮

摘要: 2020年3月后半段以来,红色中国网上每天都发表“远航一号”关于新冠肺炎疫情的文章:自3月20日起,笔者每日根据世界卫生组织提供的全球新冠病毒疫情形势报告做一些简单统计分析,帮助各位网友追踪全球疫情发展动态。他的研究过程很不严密,很可能导致明显错误的结论。

新冠肺炎患者数量增长模型分析

目前,对新型冠状病毒肺炎疫情的研究已经得到了一些结果,有必要对这些结果进行批判性的分析,本文中笔者将尝试对预测患者数量增长的模型做一些这方面的工作。

增长模型是通过严格的数学计算得到的,计算过程本身不是本文要讨论的。笔者要指出的是:建立数学模型所根据的事实即便再充分也是有限的,所以模型的适用范围也必然是有限的,给出这一范围很有必要;任何数学模型都是用很少的几个数量来描述复杂的现实世界,不可避免地带有明显的片面性,所以根据事实验证模型的准确性几乎和建立模型同样重要。

在文章[1](需翻墙)中笔者曾考虑建立患者数量增长的长期模型,粗略考虑了从今年123日到42日的情况。最终得到的结果也相当不确切,在各种增长模型中笔者不得不选择指数增长模型的回归分析结果,这一计算结果显示患者数量每天比前一天增长8%都不止。如果这一结果是准确的,那么没到8月患者数量就会超过全球人口,显然这一模型不适用于长期预测。

作为短期预测其准确度也不会太高:相关系数r=0.92030,其平方为0.847,并不算接近1。所以只能这样利用计算结果:“再过一周,当t=802020/4/9)时,根据指数回归分析的结果,估算可得患者数量约为170万,估计那时患者的实际数量不会超过这一数字。”[1]根据世界卫生组织的报告[2]202049日新型冠状病毒肺炎患者总数约为144万,笔者的估算结果作为上限大体上是可以接受的。

考虑到患者总数不会减少这一情况,要比较科学地检验结果的准确性,就应该拿预测患者增量同实际增量比较,而不是直接拿预测患者数量与实际数量比较。42日患者数量就差不多有90万了[2],笔者预测1周后患者会增加80万而实际上只增加了54万,笔者的预测结果比实际情况多了大约一半,实在是过于宽泛了。

为了比较准确地预测疫情发展,模型是一定要改进的。构建前面模型时用到的事实时间跨度超过两个月,这期间疫情的增长趋势发生了多次改变,把不同的趋势考虑在一起会带来很大的不确定性。模型涉及时间不宜过长,同样道理,模型用到的数据也不宜过多。更多的数据会带来更大的计算量和偶然性,使得规律更难以显现,结合疫情选取足够多的数据即可。

新冠肺炎的潜伏期常常为14天,考虑时间达到或超过14天才能在一定程度上反映出疫情的发展规律。考虑一个月左右的情况也可能是有必要的:潜伏期有时长达24天,但更长时间(比如四五十天)的追踪对建立以定量计算为目的的模型意义不大,因为追踪期间疫情的增长规律可能明显改变。

综合考虑上述情况以及数据的时效性和表达的简单程度,笔者决定通过研究41-15日的患者数量与时间的关系来把握疫情的发展趋势。世界卫生组织给出的报告[2]每个都很权威,为了贴近事实,在列入考虑的时间段里每一天的数据笔者都打算利用。数据整理如下表(报告的截止时间为对应日期欧洲中部时间上午10:00):

报告序号

报告截止日期

新冠肺炎确诊人数

72

2020/4/1

823626

73

2020/4/2

896475

74

2020/4/3

972303

75

2020/4/4

1051697

76

2020/4/5

1133758

77

2020/4/6

1210956

78

2020/4/7

1279722

79

2020/4/8

1353361

80

2020/4/9

1436198

81

2020/4/10

1521252

82

2020/4/11

1610909

83

2020/4/12

1696588

84

2020/4/13

1773084

85

2020/4/14

1844863

86

2020/4/15

1914916

4月日期(t)与新冠肺炎确诊人数(x)进行简单线性回归分析,可得:x=at+ba为理论上的单日患者增量)=79005t+735942,相关系数r=0.99975。两者的简单线性相关度极高,相关系数的平方为0.9995,也就是说该模型可以解释新冠肺炎确诊人数变化的99.95%,理论上相当可靠。



鲜花
1

握手

雷人
1

路过

鸡蛋

刚表态过的朋友 (2 人)

发表评论

最新评论

引用 sxm 2020-5-16 00:52
请问“模型能预测的时间不会比建立模型涉及的时间更长”是从何而来,我好像没听过这个说法。。。只知道预测越远误差越大
引用 水边 2020-5-13 03:04
建议这个朋友可以把精力做一些别的分析工作,而不是执着的拿10几个样本猜测一阶线性方程。完全是凑数据的,这怎么可能是什么理论上”可靠“的东西?你说远航一号的尝试不可靠,但是自己拿出来的东西还离远航的分析差得远。
如果真要研究”可靠“理论模型,你起码得从流行病学的传染模型开始吧。

查看全部评论(2)

Archiver|红色中国网

GMT+8, 2020-5-31 22:00 , Processed in 0.016078 second(s), 12 queries .

E_mail: redchinacn@gmail.com

2010-2011http://redchinacn.net

回顶部