红色中国网

 找回密码
 立即注册
搜索
红色中国网 首 页 经 济 查看内容

全球新冠肺炎患者数量增长趋势简要分析

2020-4-5 06:27| 发布者: redchina| 查看: 26167| 评论: 4|原作者: 壮壮

摘要: 为了澄清统计分析中的一些关键问题,笔者将从处理最笼统最基础的数据开始:这篇文章只分析全球患者总数与日期的关系,研究一下新型肺炎患者数量随时间的增长趋势。

全球新冠肺炎患者数量增长趋势简要分析

新型冠状病毒肺炎早已在全球呈大流行之势,目前患者总数仍在迅速增加,研究其增长趋势的意义不言而喻。在看到红色中国网上对疫情的分析[1](需翻墙)之后,笔者觉得:这一篇文章选择了一个很有意义的研究角度,但在进行统计分析时出了不少问题。

为了澄清统计分析中的一些关键问题,笔者将从处理最笼统最基础的数据开始:这篇文章只分析全球患者总数与日期的关系,研究一下新型肺炎患者数量随时间的增长趋势。本文中关于新型肺炎的数据均来自世界卫生组织的报告[2],网址是“远航一号”提供的。

选择全球患者数量作为变量在很多人看来都过于笼统了:世界各地疫情差别太大,视它们为一个整体不能反映情况的差异。但这样做保证了标准的统一——都是世界卫生组织综合的,也消除了各地疫情的偶然性,使得一开始就有一个较大的患者基数,有利于提高分析的准确性。

时间间隔笔者选为1周——也就是7天,很可能有人认为笔者选的时间太长了,但世界卫生组织已经给出了超过70篇报告,把间隔设为7天不会导致数据短缺,又可以在处理数据比较少的情况下认清疫情的长期发展趋势。

基本事实整理如下表:

报告日期

给出报告天数(t)

新型肺炎确诊人数(X)

2020/1/23

3

581

2020/1/30

10

7818

2020/2/6

17

28276

2020/2/13

24

46997

2020/2/20

31

75748

2020/2/27

38

82294

2020/3/5

45

95324

2020/3/12

52

125260

2020/3/19

59

209839

2020/3/26

66

462684

2020/4/2

73

896450

(报告的截止时间为当日欧洲中部时间上午10:00。)

表格中一共有11对数据,对于回归分析来说足够了。运用不同的回归分析方法研究Xt的关系(这一步是用计算器完成的),结果如下表:

回归分析方法

a

b

相关系数r

计算公式

相关性判断

线性回归

-161761

9116

0.78497

X=a+bt

中度相关

对数回归

-362080

163430

0.58267

X=a+bln(t)

中度相关

指数回归

2942.50

0.07952

0.92030

X=a*exp(bt)

高度相关

乘方回归

63.5772

2.04957

0.98210

X=a*t^b

显著性相关

反比例回归

247370

-1014938

-0.35234

X=a+b/t

低度相关

相关度较低的线性回归、对数回归、反比例回归显然不能用来进行定量计算,只有指数回归和乘方回归的分析结果有可能用来进行定量计算,但实际上的准确性仍然有待验证。



鲜花

握手

雷人

路过

鸡蛋
发表评论

最新评论

引用 陕青1988 2020-4-7 00:42
就以往传染病流行的经验来看,每日新增患者的数量在爆发前期是增加的,在得到初步控制的时期(即所谓“拐点”)是基本恒定的,在已经得到控制的时期是减少的。因此,以累计患者总数为纵轴,以日期为横轴,曲线应当呈现类似于斜体积分号的形状,即斜率先增加,再恒定,在减少,最后归零。壮壮的所有回归公式都无法反映斜率先上升后下降的规律。
统计学是服务于预测现实情况的,如果统计模型设计与现实无关,为回归而回归,那么无论相关性如何都是伪回归。
引用 陕青1988 2020-4-7 00:40
就我有限的统计学经验来看,壮壮网友的分析反而不如远航一号原有的分析。理由如下。
在壮壮最初反驳远航一号的文章中,他(我估计壮壮网友是男性)提到“你采用的是患者总数的增长率和日期这两个变量”进行拟合。这显然看走眼了,远航一号采用的是当日患者增长人数占累计患者总数比例和累计患者总数进行拟合。这两个变量在疫情进入爆发期之后是可能存在稳定的负向线性关系的(这一点正在逐渐被事实所验证)。
壮壮网友自己的分析是累积患者总数和日期的关系。壮壮选出了两个相关程度最高的回归(乘方和指数)按照壮壮得出的b值,这两者的斜率都是不断上升的,即新冠病毒每天会以一个越来越高的增长率不断扩散并且最终感染世界上所有人。这与基本已经控制住疫情的中国经验不符,也和韩国、意大利等国的数据不符。
引用 水边 2020-4-5 11:28
不是我打击作者,我还是头一次见到有人说回归分析有11个观测值就够了,样板太小,基本没有任何意义。简单的最小二乘法回归,不报告R平方,更是没啥能评论的。这个模型更是让人无语。
远航一号的统计模型,看的是总量和增长率的关系,统计方法非常直接,但是目前看来线性关系还是能解释相当一部分变化的,这样的研究不是最严密的,但是能提供有价值的信息。
引用 redchina 2020-4-5 06:29
壮壮网友发来了他自己的统计分析。有兴趣的读者可以将其与远航一号的分析做比较,并展开进一步的讨论。

查看全部评论(4)

Archiver|红色中国网

GMT+8, 2022-12-7 07:55 , Processed in 0.016080 second(s), 12 queries .

E_mail: redchinacn@gmail.com

2010-2011http://redchinacn.net

回顶部