鄂维南:保险行业要用大数据识别健康风险

时间:2016年08月18日

8月18日,由中国保险行业协会联合国务院发展研究中心金融研究所、北京保险研究院等机构主办的“2016中国保险业发展年会”在北京隆重召开。中国保险行业协会首席科学家、中国科学院院士、北京大学元培学院院长鄂维南应邀作演讲。以下内容根据录音整理,未经本人确认:

我想简单讲讲,从大数据的角度医疗健康将来会有什么样的改变。

首先讲一个例子,这是北京大学做的一项研究,讲的是中国的肾病。我们的概念是肾病来自于肾炎,但是北大这个研究是说大概从2011 年开始,由糖尿病转成肾病这个趋势已经超过了由肾炎转成肾病。肾病恶化了以后要做透析,5 年以后,透析产生的消费是 1.7 万个亿,这相当于中国 5 年以后,国家医疗方面的所有投入,包括医保的投入,这一项会把所有的医疗投入都消灭掉。所以,我们不得不从政策的角度来防范。

通常,医院里面的电子病历,还有体检数据等等这些是医疗健康大数据的来源。但还有很多困难,比如说整合的程度还不够。这一点我们大数据研究院也做了很多工作,希望把这些数据整合在一起。

再举一个例子,说说现在的这个运用学习的方法,在医疗健康领域有什么样的应用。这个例子是今年刊登外国期刊上的一篇文章,它是用医院电子病历的数据来预测常见病患者一年之内会住院的概率有多大,比如糖尿病、肿瘤等等。大家可以看到这个预测的准确性已经相当高,比如说糖尿病,准确性已经达到了90% 以上。所以新的技术,特别是深度学习,不是简单的深度学习,而是一个无间断的学习模型,已经有了很好的应用。

怎样利用医疗健康大数据的办法,来做健康的风险识别,并把它用到保险行业里。第一个例子是COPD,慢性呼吸道的病人,每年有十分之一的人是死于这个病。这个数据是由我们大数据研究院的一位研究员做的。他也是用深度学习的办法,把 COPD 的风险特征抓取出来。从主要的风险特征,跟吸烟习惯、做什么工作、体能特征 BMI 之类的相关联。通过这个方法,可以把每个特征在风险里面占的比重都比较精确的计算出来,帮助你对每个病人做风险评估。它的特点之一,就是他把基因的数据和病历的数据结合在一起,这是我们进行的精准医疗所强调的办法。

除此之外,心脑血管病也是一个,但目前的效果不是这么明显。肾病的管理给我们提出了一个严峻的考验,中国台湾在医疗健康数据的整合利用方面,可以说是远远超过了中国大陆,尤其是对肾病,他们也注意到这个问题,采用了这种管理的方法。比如他们把保费和教育结合在一起,一种是护理的教育,一种是健康教育,也就是饮食方面的教育。参加这个教育计划,保费保多少比例就会有一定的变化,通过这个变化来鼓励病人参加教育、参加培训,给病人良好的生活习惯,减低对保费的压力。比如说参加计划的人和不参加计划的人,平均每人每年相差开支基本达到 2000 新台币。

再讲一下肾病,北大医院在肾病方面做了很多工作,有很多数据。比如 5 年以上的病人跟正常人的数据,通过这个对立的数据建立了非常好的数据库,我们正在对这个数据进行同样类似的学习,希望通过这种数据来产生一个分析模型,把肾病的风险特征都提取出来,也希望我们国家以后在大陆也能建立起像台湾类似的这种教育学习的办法,来控制保费。

当然这里面还有一个比较大的障碍,从医保控制的角度来看,怎样来评价医院的质量。我们的一个战略合作伙伴是国家卫计委的医院质量监控系统,通过这种行政手段,收集了1500多家三级医院,这里面涵盖了8000多万条的住院记录,4000 多万的患病者等等。通过这个数据,我们可以对医院的质量,医院各个分科、科室、住院等等方面进行整体评估,这也是医疗健康大数据在保险方面的可能的应用。在政策方面,一个政策出台之前,我们是否就可以进行评估?阿尔法狗是围棋的利用,它背后的数学模型是一个一般的智慧决策系统,这样的系统不仅仅对围棋有用,对我们其他一般的决策都会产生效果。

大家想想我们每天做事情,大部分时候都在做决策。大部分决策都处在“拍脑袋”的阶段。阿尔法狗背后提供的思维是我们对于每一个决策都可以采用一种智慧智能的办法、人工智能的办法去实现。当然,阿尔法狗还有它的简单性,毕竟围棋是一对一的博弈,而且博弈的双方是对称的。我们通常做决策的时候,跟对方是不对称的。从模型上来讲是一个复杂的情况,但基本的思想,基本的数学框架是类似的。所以,阿尔法狗以后对智慧决策提供了新的可能。医院在诊断病人的时候,做诊疗方案的时候也是一个智慧决策的系统,这方面已经有了研究,把阿尔法狗背后的基本想法增加学习应用到里头。也有这样的例子,就是把深入学习投入到大家感兴趣的领域里头,只不过这方面的效果还不是特别的明显。

所以说,政策决策系统也可以通过类似的办法,至少类似的想法来先试一试这个决策系统会产生怎样的效果。医院的层面,我们没有好的案例给大家展示,但在其他方面,比如在交通、围棋方面已经有很好的案子。