下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

大数据告诉你现在还不是出门的时候

作者:徐九     来源: segmentfault点击数:759发布时间: 2020-02-13 16:23:49

标签: 大数据课程大数据分析课程大数据结构课程

数据模型分析告诉你,现在还不是出门的时候!大数据(big data)是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据有五大特点,即大量(Volume)、高速(Velocity)、多样(Variety)、低价值密度(Value)、真实性(Veracity)。它并没有统计学的抽样方法,只是观察和追踪发生的事情。 大数据的用法倾向于预测分析、用户行为分析或某些其他高级数据分析方法的使用。

一旦出门,你根本不知道病毒什么时候接近你,它也不会给你任何一个侥幸的机会。

经过几天的「封闭管理」,很多人已经在家里坐不住了,想着趁现在外面人不多,附近也还没有确诊的病例,出去一小会儿溜达溜达应该没什么问题。

但你们知道感染新型冠状病毒最快需要多久么?前两天的一条新闻告诉我们,一男子出门买菜,15 秒就被感染。

大数据告诉你现在还不是出门的时候_大数据课程_大数据分析课程_大数据结构课程_课课家

一旦出门,你根本不知道病毒什么时候接近你,它也不会给你任何一个侥幸的机会。以各种形式奋斗在「抗疫」一线的人们,付出了自己的时间、精力甚至是生命,不就是为了尽快帮我控制住疫情、渡过疫情么?

我们的每一个侥幸都是在用他们的生命做试探。

上海医疗救治组组长张文宏医生在接受采访时说过一段话:

如果现在还是我们医生一个人在战斗,这个仗打不赢的,肯定完蛋。现在开始每一位都是战士,这点很重要。然后整个疾病的控制,一个字 —— 「闷」。希望大家好好地在家里在隔离点闷两个礼拜,把这个病毒闷死,闷死就抗疫成功了。

如果有人还不明白这么说的原因,有一位程序员做了一个疫情的模拟仿真程序,来直观的告诉我们呆在家里、控制人群流动的重要性。

感谢项目和视频作者:B站up主@Ele实验室

疫情仿真程序介绍

该项目采用的是面向对象的语言 —— java。数学模型方面,采用的是自然界中常见的正态分布 (高斯分布)。

程序中设置的变量包含:

  • BROAD_RATE:初始感染数量
  • ORIGINAL_COUNT:传播率
  • SHADOW_TIME:潜伏时间
  • HOSPITAL_RECEIVE_TIME:医院收治响应时间
  • BED_COUNT:医院床位
  • u:流动意向平均值

但疫情的传播其实并不是这么简单,涉及到的影响参数肯定远不止视频中展示的这几项,但作者也表示制作该模型只是为了对大家进行传播及控制要素的分析。

控制变量分析

具体的分析过程大家可以在看完文章后在文末到 B 站看作者的视频详细理解,这里我们把一些分析结果分享给大家:

初始数据设置:

  • 初始感染数量:50
  • 传播率:0.8f
  • 潜伏时间:0
  • 医院收治响应时间:10
  • 医院床位:0
  • 流动意向平均值:-0.99f
  • 将医院床位数据调整为:100

当病毒慢慢扩散开来,我们需要医院建立隔离区,当把床位参数改为 100 张床,若此时我们控制人群不随意流动,疫情会很快被控制,从而被消灭。

  • 将医院床位数据调整为:100,流动意向平均值调整为:0.99f

但就像我们最开始,对于自我隔离不是非常重视,增大人群流动意向后,医院的隔离床位很快会被占满,疫情也将无法控制。

  • 将医院床位数据调整为:1000,流动意向平均值调整为:0.99f

当将床位增加 10 倍后,疫情仍然被很快控制住。如视频作者所说,这就是国家建立火神山、雷神山医院的原因。模拟程序中还有一项「医院收治响应时间」,也就是一个患者从确诊到被安置隔离的时间。如果该时间过长,疫情也将无法控制。

分析到这,视频作者提出另一个关键的影响因素 —— 病毒的潜伏期。本次病毒有长达 14 天的潜伏期,也就是参数「SHADOW_TIME」的数值应为 14。

  • 将潜伏期数据调整为:14,流动意向平均值调整为:0.99f

模拟开始的时候因为在潜伏期,很难再人群中发现并隔离患者但当潜伏期过后,就会出现爆发性增长,医院的床位也会很快被占满,疫情将无法控制。

  • 将潜伏期数据调整为:14,流动意向平均值调整为:-0.99f

但如果人群可以控制流动,虽然整体防治过程较长,但最终疫情被很好的控制并被消灭。

结论分析

通过通知变量法,我们可以发现人群的流动意向对疫情的传播和控制起着主导性的作用,再打的问题,如果控制好人群的流动,就会更容易解决。

所以就像文章开始张文宏医生所说,即使通过一线医务工作者的努力,加快了确诊效率、医院的收治时间,目前疫情已经得到了较好的控制,但是我们仍旧处于病毒的潜伏期,而这也是最危险的时期。

希望大家不要抱有侥幸心理,尤其是随着天气逐渐变好,感觉疫情已经得到很好地控制,但是放松警惕的时候恰恰是最危险的时候。因为除了国家层面外,对疫情起主导作用的,恰恰就是我们普普通通的每一个人。

在视频的结尾,作者引用了《三体》中的一句话,再次提醒大家:

“无知和弱小不是生存的最大障碍,傲慢才是。”

好好在家待着,不要辜负一线冲锋的所有人。放松警惕的时候恰恰是最危险的时候,对这次疫情起到主导作用的恰恰是我们普普通通的每一个人。

少出门、戴口罩、勤洗手,我们会胜利的。

为更好的完善程序和模型,作者已经发布了程序的源码,也号召广大的开发者们进行协助,可以自行改进和提交 pr,也希望能有专业的数学从业者提出更加准确的模型。

GitHub 项目地址:

httPS://github.com/KikiLetGo/...

B站视频地址:https://www.bilibili.com/vide...

-END-

对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

赞(8)
踩(0)
分享到:
华为认证网络工程师 HCIE直播课视频教程