全球新冠病毒疫情统计分析(5月13日)
远航一号
自3月20日起,笔者每日根据世界卫生组织提供的全球新冠病毒疫情形势报告做一些简单统计分析,帮助各位网友追踪全球疫情发展动态。4月初以来,笔者在统计分析过程中曾经数度修改线性回归样本及其起始时间。对此,有一些读者提出了质疑,没有提出质疑的读者也可能对于全球疫情的前景感到茫然。 如以前的全球疫情分析中解释过的,新冠病毒疫情是全新的事物,我们对于这个全新的事物有一个从认识到了解的过程。笔者这里采用的统计方法,简单地说,是假设新增病例会按照逻辑曲线分布,先迅速上升,达到峰值后再迅速下降。而确定上升和下降速度以及最终累计病例的方法,主要是当新增病例与累计病例之比出现了明显的线性下降趋势后,用新增病例与累计病例之比(注意:并非直接等于累计病例增长率,两者仅是近似相等)对累计病例做回归。比如,如果现在的新增病例与累计病例之比已经下降到2%,通过线性回归又发现,累计病例每增加100万例,新增病例与累计病例之比就趋于下降0.4个百分点,那么就可以粗估,当累计病例再增加500万例以后,疫情就可以基本结束。 上面所说的模型,如果是应用到一个固定地理区域传染病不受控制的传播情况或者是一个固定地理区域传染病已经得到有效控制的情况(如中国),都可以基本符合疫情的实际发展。如果看下面第三个图,在4月初以前,新增病例快速增长的情形基本符合逻辑曲线前半段的分布,先快速增长,然后增长速度迅速放慢。但是,大约从4月10日开始,新增病例一直在每日8万例上下向右平移;到了5月初,又趋于上升。粗通数学的读者知道,如果分子(新增病例)大致保持不变,而分母(累计病例)不断变大,那么新增病例与累计病例之比虽然会不断趋于下降,但是下降的速度会不断放慢,趋近于零却永远不会下降到零。在我们的统计分析中,这就表现为线性回归的斜率不断变小。这也就是笔者大约每隔两个星期就调整一次回归样本的基本原因。 为什么会出现这种情况呢?如上所述,逻辑曲线分布的假设适合于固定地理区域的情形。但全球的疫情传播并非“固定”在某个地理区域。比如,4月下旬以前,除美国以外,主要是西欧诸国疫情最严重。自那时以来,虽然西欧诸国疫情有所缓解,俄罗斯、巴西的疫情又恶化了。这些地方新增病例的迅速上升抵消了西欧各国新增病例的下降。现在,印度、加拿大、秘鲁的疫情也出现了加速发展的迹象。此外,有的国家(比如美国、俄罗斯),由于受到检测能力的限制,每天最多只能检测一定数量,从而最多只能确诊一定数量的新增病例。这样,当这些国家达到了检测能力极限以后,新增病例就会呈现线性增长的假象。如果我们是做专业的疫情分析,可以想办法对上述问题做出一定的校正或弥补。比如,单独对每个国家做统计分析,再将这些分析结果相加;设法通过其它渠道来了解病毒的真实传播情况等。这样的专业分析超出了我们的能力。 笔者在这里做的统计分析,毫无疑问属于业余的性质,主要是帮助各位读者追踪全球疫情的发展。另一方面,现有分析方法的缺陷,当然并不意味着,全球新冠病毒的疫情就会无限地发展下去。经过一段时间以后,全球新增病例总是要开始下降的。到那时,新增病例与累计病例之比的下降斜率也就会稳定下来,我们就可以对于全球最终累计病例以及全球疫情结束的时间做出比较可靠的估计了。 截至欧洲中部时间5月13日上午10时,中国(含港澳台)新冠病毒累计病例达到84458例,比前一日新增7例。国内疫情已经得到控制。 下面第一个图说明了自3月30日以来全球除中国以外地区新增病例与累计病例之比和每日累计病例之间的关系。5月13日,新增病例与累计病例之比为2.0%,与前一日相比略微下降,与一周之前的5月6日相比基本持平。第一个图显示了根据4月27日至5月13日之间的数据得到的线性回归趋势。线性回归结果表明,全球除中国以外地区累计病例最终将达到约843万例(回归R平方值0.377)。按照目前的线性回归斜率,累计病例每增加100万例,新增病例与累计病例之比趋于下降0.47个百分点。 第二个图说明了自2月21日以来全球除中国以外地区新冠病毒累计病例的情况。截至欧洲中部时间5月13日上午10时,全球(除中国以外)累计病例达到4085966例,比前一日新增81569例。到目前为止,单日新增病例最高的一天是5月9日(当日新增病例95820例)。 第三个图说明了自2月22日以来全球除中国以外地区新冠病毒新增病例的情况。考虑到新增病例大致以一周为周期上下波动的特点,第三个图对单日新增病例取了七日移动平均值。5月7日至5月13日,新增病例的七日平均值为83086例。到目前为止,新增病例最多的七天是5月3日至5月9日(七日平均值为84082例)。 按照第一个图中线性回归得出的参数,可以推算出未来累计病例和新增病例的发展轨迹。按照现在的趋势,预计全球疫情将在今年9月份趋于稳定。 另据美国的Real Clear Politics网站,截至美国东部时间5月13日下午5时(北京时间5月14日上午5时),全球新冠病毒累计病例达到约4410000例,比24小时前增加约83000例。其中,美国累计病例约1424000例、西班牙约271000例、俄罗斯联邦约242000例、英国约230000例、意大利约222000例、巴西约182000例、法国约178000例、德国约174000例、土耳其约143000例、伊朗约113000例、中国大陆地区约82900例。 |
E_mail: redchinacn@gmail.com
2010-2011http://redchinacn.net