武汉哪些人可以复工?感染者都接触了谁?这些问题他们秒回

(人民日报健康客户端记者 李桂兰)“武汉哪些人可以复工复产?新增病例都接触了谁?可能的隐性感染者到底是谁?……”

北京海致网聚的数据工程师们就是帮助管理者回答这些问题的人,武汉封城前,他们紧急驰援武汉,十个人每天处理数上亿数据,感染者、密切接触者数量、活动轨迹、时间节点……“我们的处理以秒计,但因每一条数据背后都是人命,不允许出错!”海致网聚总裁杨娟介绍道。

武汉哪些人可以复工?感染者都接触了谁?这些问题他们秒回

海致公司制作的智慧大屏效果图

武汉封城后500多万人离开,发烧的人都去了哪儿?如何找到

“真没想到,我回到武汉,就再也没离开过,而且一工作就是40多天。”1月20日晚上8点,刚放年假的海致科技数据工程师许珂抵达湖北鄂州的家中,正吃着晚饭时接到了公司的通知。第二天返回武汉。

1月23日上午十点武汉封城,“武汉封城前的人都去哪了?又有哪些是发烧的人?乘坐什么交通工具?他们都接触了谁?……”封城之后该怎么做,如何找到那些感染者、密切接触者、活动轨迹,就成了迫在眉睫的问题了。

海致科技总裁杨娟打了个比方,人群就像在地上翻滚着的黄豆,感染的人群就像装在框子里的黄豆,当框子里的黄豆撒了出去后,就会跟地上的黄豆混在一起滚动,而无法轻易分辨,封城后,这些豆子就像固定了位置一般,不再在地上随意滚动,但要找出来也并不容易,如何找出来,找出来后如何采取措施都是需要数据做支撑的。

“拿到了外流人员相关原始数据后,我们利用大数据建模手段,构建了上百个分析模型,有数据真实性的交叉验证模型,有落地确诊病例模型,有外流人员去向查找模型,有密切接触人员身份落地模型等。然后把这些模型的分析数据推送给一线防疫人员,抓紧去落地核查。可以说一个模型就是一个战场,每个战场都关乎生死。”

疫情期间的每一天,大家都关注着疫情动态新闻,比如某一位确诊病例的活动轨迹等,大家都会比较关心,他都去过哪儿,他都接触过谁?这些信息,如果我们是一个人一个人地去问,去排查,肯定是不现实的,“揪出一个人,一条线,大家可能觉得还好,工作量也不是很大,稍微费些时间能梳理清楚,但封城前有500多万人离开武汉,还有900万人留在城里,他们很快就会跟其他人接触,接触范围还在扩大,数据必须尽可能快地处理,人群才能被锁定,我们的数据处理以秒计。”杨娟介绍说。

截至3月30日24时,全国累计确诊病例81518例,累计追踪到密切接触者706017人,尚在医学观察的密切接触者19853人。“每一个人的数据每天都在更新,哪个小区的确诊了,接触了谁,谁被隔离观察了,谁住院了,谁出院了,谁在哪里隔离观察……每一个人的状态都在我们的数据系统里走着,系统里走过的数据流,屏幕上流动的数据,都是有生命的。”

武汉哪些人可以复工?感染者都接触了谁?这些问题他们秒回

受访者供图

身份证号码错了也能确定其人,整理清洗数据人命关天

疫情之下的数据就是一条条鲜活的生命。“数据的每一次改动,都意味着一个生命的状态发生了变化,很多时候,在电脑前,数据背后,看着生命从最初的密接人员数据表格一步一步挪到病亡人员表格,心里也是非常难受的,因为那个‘1’真的不是无足轻重的,是活生生的生命。”杨娟介绍说,他们做了上百个模型,里面近四成的模型是用来保证数据质量的,毕竟,每一条数据后面都是人命,不能算错。

工程师许珂家里有两位同样在一线坚守的亲属,父亲与大伯都是医生。“从疫情开始,大伯就在鄂州一线救援。但1月26日开始发热,确诊感染,2月13日很不幸没能挺过去,离开了我们,同样被感染的大伯母还在隔离治疗中。”疫情之下,我们都息息相关,而我们能做的,是尽最大努力做好本职工作。

“我们最开始接触到的数据都是各家医院、社区等系统送过来的登记数据,也就是Excel表,有的还是手工表,有的人的身份证号码填写的都是错的,如何尽快找出来,大数据这个时候就有优势了。”杨娟介绍,数据是有特点的,比如身份证号码,每一个数字都有其特殊意义,其实中间有八位数是你的出生年月日。可能你也知道,但是我可能他前几位错了,但是我基本上可以通过这个年月日加上你的姓名我们可以根据一组数据中的多个数据特点确定正确的身份证号,也能在跟公安、交通等系统对接后,交叉比对确定其人的活动轨迹,相关接触人的活动轨迹等。

疫情中成立的防疫指挥部,是由卫健委、医院、疾控中心、公安、交通、通讯等联合组成的。防疫指挥部会下发一些数据核查、数据分析的需求,然后由数据工程师们配合相关部门完成后,再把分析结果提供给指挥部,以供决策。

事实上,各级政府部门有上百种数据,存储总量极为庞大,分散在不同部门,同时各级医疗防疫机构,还拥有大量一手疫情数据的手工表格。“短时间内,我们要接入各个部门的数据,做数据处理、清洗、关联,形成数据模型。”许珂介绍说,这些冗杂纷繁的数据,要迅速的形成一套高效的数据接入、清洗、处理的机制,转化为精准的防疫信息,传递到防疫指挥部。“我们这里输出的数据不能有错,毕竟,政府要靠这个去做决策,去指导医院、社区的具体工作。”杨娟介绍道。

“数据流转机制刚刚建立,模型也都是摸索着做,改动很频繁,要的也很急。那是疫情爆发的第一阶段,需要做很多东西去摸索。”新冠肺炎诊疗方案试行已到了第七版,我们的统计标准,模型建立原则也都跟着在调整,“每日的数据每日结清,每日的数据中各类关注对象信息都要当日上报。这些原始的一手资料,只能由武汉团队第一时间进行归纳,相比较其他城市的防疫,武汉的工作量都是乘以百计、千计、甚至万计、亿计。”杨娟这样介绍这段时间的日常工作。

武汉哪些人可以复工?感染者都接触了谁?这些问题他们秒回

受访者供图

武汉解封在即,哪些人可以复工复产,还是要大数据说话

“从3月25日零时起,武汉市以外地区解除离鄂通道管控,有序恢复对外交通,离鄂人员凭湖北健康码‘绿码’安全有序流动。从4月8日零时起,武汉市解除离汉离鄂通道管控措施,有序恢复对外交通,离汉人员凭湖北健康码‘绿码’安全有序流动。”这是湖北省人民政府官网发布的《湖北省新型冠状病毒感染肺炎疫情防控指挥部通告》的内容。

“虽说是复工复产在即,但并不是说我们的工作就结束了,相反,我们还是会很忙。”

除了更新每天的感染者、密切接触者数量、活动轨迹、时间节点等信息外,数据处理师们还得给出:哪些人可以复工复产?复工复产的人都在哪儿上班?这些人的家里有没有四类人员?杨娟介绍说:“就比如,复工复产了,人们都会选择交通工具,比如坐公交车,哪个人体温上升了,他接触了谁,我们都必须第一时间从各个部门的数据中找到答案,我们处理数据都是按秒算,毕竟,这会给复工复产留下巨大隐患。”

2月22日,许珂与同行的两位同事,被安排去构建湖北全省的防疫大数据平台。“我们会做一些风险预警的模型,及时发现一些可能的发热患者,或者疑似病例,防止再次扩散。”

“目前,海致网聚公司已经服务了包括湖北、广东、上海、北京在内的243个省、市、县疫情防控分析支撑工作。具体来说,我们搭建疑似和密切人员分析名单、医疗收治和返程复工等各类模型两千余个,发布各类分析计算结果数据过亿条。”杨娟说,“战疫”接近尾声,但尚未结束。