邓侃:AI用于医疗的主要核心诉求就是克隆医生的大脑

光山新闻网 admin2 2020-11-16 00:00:00
浏览

  11月11日至15日,第二十二届中国国际高新技术成果交易会将在深圳举行。本届高交会以“科技改变生活、创新驱动发展”为主题,总展览面积超过14万平方米,有3000多家海内外展商、近万个项目参展,各项活动将超过140场。大数医达创始人兼CEO,复星集团首席人工智能科学家邓侃出席并演讲。

  以下为演讲实录:

  邓侃:谢谢大家,非常荣幸今天能有这样一个机会来向大家汇报一下我们在人工智能医疗方面的一些小进展。我的名字叫邓侃。我先前是在百度负责网页搜索,离开百度之后就创业,专门把人工智能应用于医疗,它的主要核心的诉求就是克隆医生的大脑。为什么这么做呢?因为我们知道医疗行业里面最大的问题是专业医生的缺乏,而且专业医生的地理分布极其不平衡,越是偏远越是需要医生的地方往往医生特别的少。

  我们先前有一个阿尔法狗,打败了我们人类最高端的围棋的选手,这时候大家有个悬念,什么时候电脑能够像人类医生那样来看病。于是在2017年的时候第一篇论文在nature上发表了,他和斯坦福研究院一起合作,识别了常见的皮肤病,这是我们看到的第一例第一篇把深度学习应用于医疗行业的高端论文。紧接着他开启了一个新的时代,到了2018年的时候,另外一个斯坦福的教授也做了这么一件事情,他拿电脑来识别心电图。所以我们看到,我们星星点点越来越多的发现在深度学习应用于整个医疗的时候,我们会有很多很多的突破。然后我们创业了,我们创业的使命是直接形成闭环,而不是星星点点的东打一枪西打一枪。什么叫闭环?首先,先了解一下患者主观上有什么症状有什么不适,我们根据他前一步的情况决定下一步我们要做什么样的化验什么样的影像的检查。然后下诊断结果,诊断结果就是确定这个病人患了什么疾病,有了诊断结果就下医嘱,整个步骤合在一起我们叫诊断和治疗的闭环。先前我们看到星星点点都是闭环中间的某一个步骤,而我们是世界上第一例寻求整个闭环的技术。

  这个事情听起来很玄,但实际上道理很简单,我们所有做的深度学习的人都知道,深度学习第一件事情要训练数据,所以我以前在百度负责网页搜索,我们直接就把这个搜索引擎的技术应用于医院内部,我们在医院内部给医院提供病例搜索引擎。但事实上我们的诉求是干嘛呢?是通过搜索引擎来收集医院内部的病例数据,我们在医院内部,一份都不拿出去。我们处理过8亿份病例,大概折合2亿患者。一家小公司,即便在中国是默默无闻的。但是我们拿到8亿份病例在全世界范围这也是少的,这是我们中国人口的红利。第一件事情我们做私有云,做病例搜索,我们通过这个办法搜集了大量的病例数据8亿份,这是全世界最大的。拿得很快,处理的时候非常费劲。我们要干嘛呢?要用深度学习的NLP技术要把每一份病历里的自然语言拆解成一串key value path,病例在我眼里不再是一团团的字了,而是一串,像蜈蚣一样,我们称之为真实世界的临床路径,8亿份病例在我做完NLP之后是什么东西?可以理解为滴滴打车的8亿条路径,中间有很多噪音杂音甚至是错误,但是不妨碍。如果我们把8亿条真实世界路径拍在一张纸上你看到的是什么东西?看到的是一张地图,点和点之间有连边的医学知识图谱。举个例子:比如有个症状叫咳嗽,咳嗽跟什么疾病有关呢,它跟肺结核有关系吗?上呼吸道感染感冒有没有关系?会有一点点的关系,一个是拓扑问题,你咳嗽和骨折没边没关系。第二个有边的情况下它有没有权重关联性强弱的关系,这样的话咳嗽跟肺结核就相关性极大,但是跟感冒也有相关性,这就是权重。我们做到什么地步呢?医学非常复杂,那个点与点,边上的权重是可变的,它不是一个常数,所以非常难做。所以我们做了hyper-node、hyper-edge。这个即便拿到美国我们也是领先的。

  我们有了地图之后形成闭环,闭环是干嘛?闭环是从症状开始你一路怎么走到诊断结果,再从诊断结果一路走到怎么到治疗,最后症状结束,消失。所以这个整个通道就像在地图上走迷宫一样走一圈,这就是我们所说的整个临床的过程。临床过程我这里讲一个词叫深度强化学习,谁做得最出名?阿尔法狗。我们就是医疗行业的阿尔法狗,因为整个原理几乎是一样的。

  医学范围太大,所以我们第一件事情要集中一点,缩短我们的再现,以至于我们形成一个突破,能够走向纵深。所以第一刀我们根据国家卫健委规定的387种基础常见病,其中有西医和中医,我们核心就是降低难度,我们光做这个就做了好几年,虽然是常见病,还是要做好几年。我们现在基本上能达到什么水平?我们跟人类医生PK的时候,跟副主任医生级别应该是一致的,甚至是我们是稳定的好。所以我们在很多医院都上了这套系统,200多种西医疾病。同时我们还有急救系统,同时还能够处理一部分的外伤,告诉你这个外伤是怎么处理的。

  刚才我们讲了说我们就是医疗行业的阿尔法狗。为什么呢?这里面既有深度学习。什么叫深度学习?你看它下面,RNN所有的症状都是添油式的对话式的,咳嗽,医生就问有没有痰,然后再问什么颜色的?什么味道?

  接下来干嘛呢?我这里有一个,非常有争议,但做的效果非常好。把不定长的病情序列,压缩成为定长的张量,再接下来你要去查医疗文献,去查真实的案例,这也是全世界最高端的东西。在所有医学资料里找出最相关的东西补充进来,为什么要讲强化学习?如果你来一个病人,你有足够的时间足够的钱把检查全部做一遍,但事实上对身体是有损伤的,我们要选择最有可能发现疾病病因的那个实验去做,而不是全面做一遍。所以就像下棋一样你落子落在哪里,典型的强化性学习,阿尔法狗用的技术就是这样。效果非常好。

  影像部分我们不做,但我们做了一个开源的插件,这样保证整个生态大家可以协同并进,所以我们做了一个开放的插口。我们跟其他的同业者都不是竞争关系,都是朋友关系。

  整个这套我们做了一个医疗级别的操作系统,从下面的底层技术开始,中间的隔断层,到上面的应用层,整个合在一起,我们称之为医疗大脑也好,操作系统也好,我更愿意称作操作系统。

  这是我们做了简单一些成功案例,比如说广东省第二人民医院是全国最早做人工智能医疗的落地医院。我们在那边它是给整个的广东北部地区2277家基层诊所做,我们把人工智能医生投放到那个地方。这是我们的一些成功案例。

  这么一点小事情人民日报也报道了,效果非常好,改变了偏远地区缺医少药的问题。

  江苏省一直是医疗大省,它铺了一张网,连接所有江苏省内大大小小的医院,数据上来了,缺乏数据处理的能力。以至于它对AI医生的需求特别强烈,所以我们给它专门承接了江苏省卫健委的医疗大脑。今年的疫情我们在2月份花了将近1个月的时间把我们的人工智能筛查工具推向了全省所有医院,加起来大概有400多家,一个月搞定。

  成都华西医院,我们做了急救系统。

  监狱,犯人出来看病不容易,但是戒毒所医务所的医生又需要帮助,怎么办?人工智能医生上。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。