“我们已经全面进入一个新的数字化时代,正在进入一个未来的智能时代。基于大数据+人工智能,能够做到比较精准快速的疫情防控。”
“通过'平战结合'的思路,研究构建国家级突发公共卫生事件的大数据平台的关键技术和机制,最终建成应对公共卫生事件和应急事件的完善系统和规范工作流程。”
近日,由北京智源人工智能研究院主办的2020北京智源大会“云上”开幕。大会共设有“AI防疫”“AI医疗”“AI创业”“人工智能伦理、治理与可持续发展”等19场论坛。作为北京智源人工智能研究院“智能信息检索与挖掘”方向的首席科学家,中国人民大学高瓴人工智能学院执行院长文继荣教授在“AI防疫”专题论坛上分享了大数据人工智能用于“疫情防控”的报告。
文继荣教授团队曾在新冠肺炎疫情爆发初期,通过北京智源人工智能研究院,参与了北京市的一系列抗疫工作,研发了一款Contact Tracing追踪系统,为北京市抗疫贡献了重要力量。本文呈现文继荣教授在“AI防疫”专题报告上的精彩演讲:大数据人工智能在疫情防控上的经验和反思。以下内容根据文教授现场演讲实录整理。
AI+防疫专题论坛非常及时,2020年1月28日,我们启动通过AI来做疫情追踪的项目;2月2日系统正式上线,生成了首批筛查名单;2月17日启动企业复工复产项目;2月24日增加疫情AI的态势感知系统。整体是一系列持续的工作进程,这些系统目前还在继续运转,服务北京市的疫情防控。
系统一:新型冠状病毒肺炎防控智能追踪服务系统
系统希望借助技术手段,对新冠肺炎的密切接触者进行定位和筛查,并快速处理,同时汇聚多家互联网公司数据,利用用户在移动互联网的“数字脚印”,围绕风险人员绘制分析人员轨迹信息,通过算法进行高危风险人员分析、追踪与筛查,确定密切接触人员名单,快速定位到重点防范区域、防范人群。
北京市启动这一系统在1月28日,反应非常快。团队慷慨贡献人力、数据和计算资源,我们在2月2日生成了首批数据。系统持续发现疑似接触人员超过10000名,并能自动生成活动报告,使得疫情防控做到"提前感知、提前预防、提前预警",从而降低传染风险,为流行病学调查提供包括精细时空信息的参考,服务和支撑了北京的疫情防控工作。
确诊患者活动轨迹实例
其中的技术处理流程很复杂,确诊患者的轨迹数据分布在多个互联网公司的系统或多个运营商的系统,每个系统只能捕捉个人片段化的数据,比如打车和购物的数据分布在不同系统中。我们为了得到较全面的接触者数据,需做轨迹的拼接,在此基础上综合定位算法,计算他们的密切接触者并汇总,最后用人工智能的算法,自动生成个人情况报告给防疫机构。
系统二:疫情实时时空风险预警(时空足迹)
复工复产后如何进行精细化的防控?我们通过加强对时空轨迹数据的采集,引进智能算法进行时空轨迹数据分析。借助大数据、人工智能技术进行更科学、更智能、更精准的疫情防控和人员隔离。针对当前复工场所的防疫,最开始采取的措施是发现一例确诊整栋楼封闭隔离,之后可以做到分类隔离,分级隔离。在写字楼等人员密集区域,基于蓝牙、局域网信号、气压计等信号,研究人群时空轨迹,追溯近距离接触人员,做到智能防控,精准隔离,有效的降低隔离成本,护航复工复产。
以上大致介绍了我们在疫情防控期间做的两件事,共同点是基于大数据+人工智能,尤其是通过人的轨迹、行为来收集和整理数据,在此基础上再用算法计算密切接触者,最后推算这种接触的危险等级等,能够做到比较精准快速的疫情防控。
但是疫情还没有结束,我们还应该继续思考。
思考一:下次能不能做得更好
突发性高传染的病毒疫情等重大突发公共卫生事件从来就没消停,一直是现代国际社会面临的共同难题。中共中央总书记习近平2020年2月14日下午主持召开中央全面深化改革委员会第十二次会议时曾发表重要讲话,强调要改革完善重大重大突发公共卫生事件防控救治体系,要鼓励运用大数据、云计算、人工智能等数字技术,在重大突发公共卫生事件监测分析、防控救治、资源调配等方面更好发挥作用。
所以我们希望国家出面,打造重大突发公共卫生事件大数据服务平台。最重要的是,通过“平战结合”的思路,建立多种数据采集渠道,围绕关键数据的采、治、用、管,研究构建国家级突发公共卫生事件的大数据平台的关键技术和机制,最终建成应对公共卫生事件和应急事件的完善系统和规范工作流程。这是从平台级别思考,大数据人工智能应该做的事情。
思考二:完全的隐私保护是不可能的
坦率地说,在处理疫情这个公共事件中,我们接触到了很多隐私数据,能不能完全解决隐私问题:既没有隐私泄露的忧虑,还能同时实现公共利益?我认为,完全的隐私保护是不可能的。今年4月份,苹果和Google联合推出疫情追踪系统,现在他们希望在操作系统上集成这样的追踪系统,使得每个人都可以用系统来做追踪和预警。这是一个很大的举动,尤其是他们可以直接把这个能力做到了操作系统级别。
苹果和Google做了大量工作保证数据的隐私性,用户可以自己选择是否使用这个功能,也可以选择数据是否重新上传。用户收到警告说“我接触过一个患者”,但无法判断具体是谁,只知道曾经接触过。在如何判断“谁是感染者”上面,有获取隐私数据的一种经典方法,苹果和谷歌的系统无法有效解决这一问题。但这是否是一个严重的问题?答案可能是否定的。实际上不存在绝对能够解决隐私的方式,类似的事情在人类历史上发生过很多次,我们相信技术,但这个问题不能光靠技术解决。更多需要技术、政策和法律结合起来,社会的进步一定是在各个层面的平衡中向前发展。
思考三:公共利益和个人隐私的让渡
疫情中还有另一个思考,即公共利益和个人隐私的让渡。这次疫情凶猛,大家似乎对个人隐私不那么担心了。但是公共利益和个人隐私的让渡问题恰恰是我们应该讨论的。因为我们已经全面进入一个新的数字化时代,变化之快超出想像;我们正在进入一个未来的智能时代,除了生活在物理世界之外,数字世界已经形成,我们的很多活动都被数据记录,同时有了“数字孪生”的概念。个人记录和数字化信息,怎样被安全有效地使用本身就是一个我们必须面对的问题。事实上,我们已经在不知不觉地让渡个人隐私,以便能够得到更好、更个性化、更方便的服务。数字化浪潮不可避免反映在对数据的利用上,与中国产业的飞速发展和数字经济都有关系,我们应该持一种开放包容的态度、会更容易促进整个社会的发展,包括疫情防控。
之前曾和清华大学的张钹老师聊过,他特别指出,在集体利益和个人利益、公共利益和个人隐私方面,东西方的观点不一致。东方人更倾向于让渡隐私,西方比较重视个人隐私。有意思的一点是,疫情期间关于隐私数据,即使在西方,好像也很少有讨论。所以公共利益到了什么程度大家愿意去让渡个人隐私?什么情况下会有所保留?政策法律对此如何界定?这些问题在后疫情时代应该开始讨论,疫情还没有结束,我们还需要思考。