在2018年的商汤人工智能峰会上,商汤医疗正式对外亮相。
与大多数搭建在已有底层系统的AI公司不同,商汤最大的特点是“平台化”。而这种策略,意味着前期更多的资源投入,以及后期更快的成果产出。
推出两年多以来,商汤的医疗又有哪些新的故事?这些故事又能为医疗AI行业带来哪些新的气息?
“以前我们经常讲‘研究推动产品,产品推动商务’,这通常是在一个新兴技术刚刚出现的时候,因为这时市场还不知道你能干什么;等到市场逐渐对技术有了一定程度的认知之后,就应该反过来‘由商务驱动产品,产品驱动研究’,形成一个良性循环。到了这个阶段,就需要企业认真思考几个经典战略问题:‘客户是谁?痛点是什么?你有什么方案?’”
张少霆在接受雷锋网(公众号:雷锋网)采访时,介绍了自己对商汤医疗AI战略的思考。而这些思考的结果,也体现在了商汤医疗今年对外透露的成果:产品上,新推出了心脏冠脉、肝脏等诊断方案;学术上,探索联邦学习在医疗数据隐私上的可行性以及数据标注噪声等方面的研究。
用工具链解决“长尾问题”
一个好的医疗AI产品该满足哪些特征?
中华医学会放射学分会主任委员金征宇教授在今年WAIC商汤企业论坛上表示,人工智能影像产品有四个标准:功能易用性、效果鲁棒性、临床专业性、应用多样性。
商汤科技副总裁、商汤研究院副院长张少霆向雷锋网表示,金征宇教授的标准是从医生的需求角度出发,而要落实医生的需求,医疗AI的工作要做好两方面:研发高精度的算法、开发适应工作流的产品。
在今年的WAIC商汤企业论坛上,商汤科技CEO徐立说到,要解决长尾行业应用的实践,不能只聚焦在头部的应用当中。人工智能不能只有一个亮点、解决一个核心的问题,真正要做到效率的提升,需要解决大量的细节问题。
医疗AI行业就是一个典型的长尾应用行业,不同的部位、不同的疾病、不同的诊疗环节当中,都存在着可以使用AI技术提升效率、提高准确度以及提升能力的场景。
但是这些不同的应用场景,很难抽象出一个或几个通用模型来解决问题。医疗AI行业的长尾特性,就使得像行业刚刚起步阶段,各家公司纷纷投入大量人力,针对某一个问题标注大量数据来训练模型,并且通过大规模落地医院打磨产品的开发方式难以持续。正是因为这个原因,新应用的推出往往较慢。
顺着这个思路,从两年前开始,商汤就提出了“工具链”的概念:用AI算法迭代AI算法,生产更多的模型。
张少霆说到,“去年,我们的商用模型数量超过研究员的数量,这也是‘解决长尾问题’这个思路下的产物。”
另外,长尾场景的另一个问题则是,很多场景很难找到大量的经过高质量标注的训练数据。在解决小样本以及噪声标注的问题上,商汤也有了一些成果。
“最近我们有几个研究性成果可以应对多中心数据的差异性,以及不同标注粒度的混合监督等问题。从算法层面,我们主要做了这两个维度的努力,以解决长尾场景。”
从应用扩展来看,去年,针对临床医生的实际痛点和商汤本身的战略逻辑,商汤正式推出了SenseCare®️智慧诊疗平台,该平台由两大引擎驱动:高并发三维渲染能力及可拓展的临床AI应用。
简单理解来说,SenseCare®️智慧诊疗平台的两个引擎可以类比于提供电力的发电机,其标准化和模块化的设计则像插座和插头,各个临床科室的AI应用则可以理解为一个个用电的机器。
随着这些AI应用不断丰富,就可以自由组合,形成适合不同地区、不同等级、不同专业方向的医院的覆盖诊断、治疗及康复的完整工作流的智慧医疗解决方案。
在这次WAIC上,除了展示原有的肺部、骨肿瘤、病理几大应用,商汤还推出了心脏冠脉的诊断产品,今年下半年即将推出肝脏疾病的诊断产品。
“提到影像AI,大家都会想到那几个标准化的产品:肺结节、骨龄、乳腺这些诊断软件,而且各自独立。但介于不同的医院、科室和医生对诊疗流程中各个环节的需求存在差异,因此对医疗AI产品的诉求也就各不相同。”
以结节为例,早筛的医院和肿瘤医院差别较大。早筛主要关注小结节敏感性,肿瘤的诊疗要看一定尺寸以上结节的生长速度。同理,做穿刺和做切除的医生,关注点也不一样。
因此,这就要求医疗AI公司做好两个点:一方面用算法能力解决长尾问题,另一方面,增强平台的扩展性,缩短新应用的开发和部署时间。
而这样的思路,也是商汤“平台化”的映照:当智慧医疗平台作为基础设施为一家医院整体赋能时,需要尽可能地满足多个科室的需求,同时兼顾未来的可扩展性,减少进行单点产品的采购成本,避免重复性建设。
今年,张少霆代表商汤参与编写了由人民出版社出版的《新基建:数字时代的新结构性力量》中与智慧医疗相关的内容。
他表示,编写的过程让自己有机会站在更宏观的角度来思考,当政府把医疗人工智能作为未来十年社会基础建设的一部分的时候,企业应该拿出什么样的产品和方案,来满足基础建设的需要。
“内生性”的平台化战略
“平台化”的思路,并不是商汤一家独有。
例如,医疗器械的三大领头羊,从两年前就开始部署数字化医疗应用的大平台:西门子的Teamplay、GE医疗的Edison以及飞利浦的神飞云,通过自研应用以及在行业里寻找合作伙伴的方式,给自身增添更多的丰富性。
除此之外,像英伟达的Clara平台也依照这个思路进行布局。
对于巨头们的这一思路,总部在美国的深透医疗创始人宫恩浩就解释到,美国医院的IT部门非常保守,行动迟缓,他们不愿意同时和十几家公司合作来改进IT设施。因此,相对来说,marketplace是一个比较理想的解决方式。
此外,雅森科技CEO陈晖曾向雷锋网表示,平台化转型的一个原因是,各家都希望用更多的数据创造更多的产品形态。
但是,商汤与其他器械类企业的“平台化”战略区别在于:一个“内生性”较强,一个“开放性”更足。
整体看来,商汤的平台化战略需要需要企业对行业有更深的理解,能够站在全局的角度来审视客户的流程痛点。但是,从另一个角度看,这也会对企业提出更高的要求:从不同医院客户的众多需求中,分辨出具有普适性的需求。
受制于B端客户细碎的需求,ToB公司给人的一个感觉是辛苦的项目制模式。因此,在医疗这样B端属性明显的行业里,创业公司需要追求“高复用率”,进而降低产品的边际成本。
对于这样的实际情况,张少霆认为,“算法可以多线同步进行,但产品需要经历开发、落地验证、迭代优化的过程。要做一款较完备的落地产品,即便在我们这样一个平台型架构上,半年的时间也是比较正常的周期。”
然而,做平台产品的企业,最关键的还不在于架构的设计,而是在于对业务的梳理和收敛。
张少霆说到,商汤医疗会在SenseCare®️智慧诊疗平台上做更多满足“基础设施”标准的产品,尽量避免纯定制化的内容,因为一个完备的产品需要时间的调研和打磨。当价值点满足大多数医院的需求,我们才会考虑。
联邦学习,能否改变医疗数据的游戏规则?
除了复盘一年里商汤医疗的产品,张少霆还花了比较多时间谈论公司在学术上的成果。
毕竟,商汤被称为中国AI博士密度最大的学术基地。
而这一次,他们瞄准了医疗数据安全——这是一个老生长谈的话题,但也是一个老大难的问题。
金征宇教授在演讲中也谈到,“AI在医学领域的应用还存在着很多伦理、隐私、信息安全问题亟待解决。AI研究需要从纯商业利益驱动提升到公共政策驱动,接受政府、社会的监督。
实际上,关于医疗数据安全的信号,一直在不断释放。
2018年4月,国家卫生健康委发布《关于印发全国医院信息化建设标准与规范(试行)的通知》,对二级及以上医院的数据中心安全、终端安全、网络安全及容灾备份提出要求。
至此之后,多项监管政策不断落实到医疗行业,国家对医疗行业网络安全高度重视——无论从医院、基层医疗机构信息化建设,还是当前发展火热的“互联网+医疗健康”、“医疗大数据”,都在强调落实做好网络安全工作。
在张少霆看来,数据安全应该分为两个维度:
首先,产品在医院落地后,日常数据如何保持安全性;其次,基于多中心大数据的算法开发,能否遵守数据不出院的严规。
针对第一个问题,商汤医疗去年提出的一个方法就是高并发且可交互的远程三维数据渲染,保证数据不出数据中心、不离开医院,但仍可以像本地工作站一样分析数据。
第二个维度,为推动AI的应用规范,商汤科技在去年成立了AI伦理委员会,并在今年6月与上海交通大学清源研究院联合发布《AI可持续发展白皮书》。白皮书的一个论证重点是:怎样在严格管控的前提下进行算法开发,既要避免出现“一管就死”也要避免“一放就乱”。
“我们一方面在看国际的经验,同时也要关注国家的政策,通过一些准则的制定,帮助国家把AI产品数据规范慢慢理顺。”
对于医疗数据安全,除了政策层面的约束,其实在技术层面也有不少的方法,比如说联邦学习。
2016年,谷歌提出了针对手机终端的联邦学习,微众银行AI团队则从金融行业实践出发,关注跨机构跨组织的大数据合作场景,首次提出“联邦迁移学习”的解决方案,将迁移学习和联邦学习结合起来,为解决多中心数据孤岛的问题提供了一个很好的解题思路。
但是,张少霆也坦言,在医疗行业,传统的联邦学习方法需要联动多家医院,进行不同中心点之间的通信,这样的环境很难部署。如果由企业端去发起,难度很大,而是更应该由监管方自上而下地推动。
考虑到传统联邦学习的弊端,在今年入选ECCV的一篇论文中,商汤提出了基于分布式生成对抗网络(GAN)的结构来实现。
在传统的方式里,参与方最后会得到一个具体的任务模型,比如一个脑肿瘤的分割模型。而商汤提出的方法则是通过生成对抗网络的博弈式学习,最后得到的是一个数据生成器,可以生成近似真实的脑肿瘤的医学图像。
商汤的一位研究员给我们打了一个比方:数据生成器的学习过程有点像给嫌疑人(原始数据)画像,画像师(生成器)从没见过嫌疑人,但通过多个目击证人(各中心鉴别器)的反馈描述,最后画像师(生成器)画出了和嫌疑人相似度很高的画像。
从这个过程中,商汤方法就能学习到数据生成器。与此同时,生成器可以生成训练数据,形成大数据库,供下游的具体任务模型使用,使模型可以不再依赖多中心原始数据也能持续扩展改进。
值得注意的是,生成器有一定程度的终身学习能力,来应对实际应用中可能出现的动态变化的多中心环境。比如在学习过程中,不断有新的中心加入或某些原有中心退出的情况。
“这种方法有很大的想象空间,可以说为解决所有医疗AI模型开发和验证中不可避免的数据伦理问题提供了一个全新的思路。对机器学习算法类公司来说,有了数据之后,就可以生成数据集,而且不涵盖任何的安全信息和隐私信息;对监管方来说,直接收集医院的数据也有很多隐患。但是生成模型就可以帮助监管方动态地生成数据库,帮助进行算法的横向评估、后续迭代。”
当然,张少霆也表示,目前这个算法仍是进行“探索性”的工作,短期内还不会将其商业化。
医疗AI迎来最好的时代
今年,是医疗AI行业最好的一年。
细数一下上半年,已经有三款医疗AI产品获NMPA的批准,顶层设计不断成熟,国家也陆续出台了相关政策鼓励AI产业发展,推动AI技术与产业的深度融合和落地应用。
进入2020年,“新基建”的建设步伐开始加快。
北京、福建、河南、云南、广东、江苏等多地已经发布2020年重大项目投资计划清单。据不完全统计,目前各地关于“新基建”的投资计划规模合计已超40万亿元。
去年世界人工智能大会期间,张少霆在接受《澎湃新闻》采访时表示,如果未来人工智能发展得像水电煤一样,在生活的方方面面、各个环节都能降低具体某项事情的成本,使大家都能够用上,这会是商汤期望看到的现象。
客观看来,在社会和行业的综合利好下,以“医学影像AI”为代表的医疗AI行业,还有非常多的新故事可以讲述,这就需要医疗AI公司们,在学术和产品上集思广益,贡献更多的新思路和新方法。
雷锋网原创文章,未经授权禁止转载。详情见转载须知。