“标准先行,数据为重”——AI医疗影像商业化的终极“方法论”

2019-08-29 作者:华强微电子 来源:连接网

分享:

[摘要]标准之后,要深入解决AI医疗影像技术的落地难题,还需要更多的去挖掘高质量的基础数据。纵然,中国借助于如此庞大的人口优势,多年来已经获得了海量的医学影像数据,但实际上这些基础数据中真正能够为AI所高效利用的部分并不多,大样本和高质量的数据获取依然是本土AI医疗影像技术的缺憾,这会造成诊断精确度低、投入高回报差甚至信任缺失等严重问题。



对AI医疗产品来说,2019年可以说是落地的关键一年。6月29日,国家药品监督管理局医疗器械技术审评中心正式对外发布了《深度学习辅助决策医疗器械软件审批要点》,为相应医疗器械软件注册申报提供专业建议,文件对人工智能软件的数据质量控制、算法泛化能力以及临床使用风险等问题进行了明确规定。这也使得以AI医疗影像技术为代表的一众本土“AI+医疗”企业闻风而动,为推动产品的落地和市场化加速奔跑。不过,AI医疗影像技术要实现全面商业化,前期仍面临有效数据量少以及标准不统一等一系列关键问题,如何从各个角度逐一攻破、去伪存真,值得每一家志在深耕本土AI医疗影像市场的企业去深入思考。

“AI+医疗影像”需求日益迫切 技术融合亟待标准统一

对于中国这样一个人口大国来说,医学影像的市场潜力可谓十分巨大。据统计,截至目前中国医学影像的检查总数已经超过了75亿,而且随着设备越来越复杂、信息量越来越大,以及图像从二维走向三维、静态迈向动态,数据量每年也在呈现飞速增长的态势。不过,从中美两国的医学影像数据年增长率来看,中国以30%的增长率落后于美国的63%,而放射科的专业人才年增长率更少,目前为止整个中国的影像科和病理科人才加在一起也仅8万左右。这种海量图像数据带来的挑战,加之专业医疗人才的稀缺,使得本土AI医疗影像检查/筛查的需求日益迫切。

AI究竟能何种程度上提升检查/筛查效率?上海联影医疗科技有限公司X射线事业部CEO向军举例到:“典型比如我们做的X射线胸片的筛选,从大概12万的病例做检查,覆盖了肺部常见的9种疾病,其中挑选了4种典型的疾病,相当于是胸片的预筛。我们可以通过AI的方法把彻底没有病的这部分快速筛出来,将健康的部分筛出去,可以大大降低医生的负担,从不同的疾病把医生的工作量从76%降低到35.9%,同时它的漏诊率也达到了一个相当低的水平。”

而从实际应用来看,向军进一步补充到:“放射治疗的前期一般都要做相应的靶区规划以及靶区的分割,就是将靶区给勾画出来。如果按照传统的办法,十分费时费力,但采用深度学习的方法,我们就可以将分割时间缩短到传统分割方法的5%,同时分割的成功率从90.1%提高到97.8%,这是目前我们对外售卖的产品上已经能够达到的实际效果。”

尽管“AI+”的效果如此明显,但缺乏统一标准的应用再好也难成大器,这也成为困顿本土AI医疗影像技术迈出市场化关键一步的最大障碍。尤其是对医疗这一特殊而复杂的行业来说,不同病人的病理指征通常不同,而且可能针对同一种疾病,各医生给出的意见也各有差别。这种变幻莫测的复杂状况,也极大提升了当前医疗影像技术与AI结合的难度。

汇医慧影创新事业部总监左盼莉十分认同该观点,她表示:“目前最大的问题就在于标准,比如现在的肺结核诊断中,国家有个标准是通过DR生片来判断,不同级别的处理方式也不同。而且,这个判断也不是定量的,不同医生之间无法达成一致的意见,基本上没法统一。这种现状也使得做AI算法越来越难,因为AI算法的第一要求就是标注要完全正确,所以现在包括标注问题、医生之间意见不统一问题等,都需要从算法角度去解决。”

具体比如,随着AI医疗影像数据的逐步积累,针对大量不同的症状和情况,AI神经网络需要不停的进行学习和自主优化来改进算法,逐步趋近于更精确的水平,有业内资深人士对记者表示:“从医生角度来讲,今天这个人是一种算法,换一个人又需要调整成另一种算法,如果这个算法累积的越来越准确且没有问题,很容易就能获得批准。但是,如果输入的数据,一个地区可能是这一种病人,换个地区这个病人的情况又有所不同,可能在之前的地区AI医疗影像诊断的很准确,但在另一个地区诊断的又不准确,这就会造成很大的混乱。所以,标准化问题现在非常急迫。但目前来讲,国家药监局也正在摸索和学习当中,国外在这方面的标准其实进展也不多,国家对此也是十分重视,毕竟现在很多医疗类人工智能产品至少可以送检了,相比之前已经有了很大的进步。所以,标准的统一还需要有一个过程。”

从“知能”到“智能”:大样本和高质量数据不可或缺

标准之后,要深入解决AI医疗影像技术的落地难题,还需要更多的去挖掘高质量的基础数据。纵然,中国借助于如此庞大的人口优势,多年来已经获得了海量的医学影像数据,但实际上这些基础数据中真正能够为AI所高效利用的部分并不多,大样本和高质量的数据获取依然是本土AI医疗影像技术的缺憾,这会造成诊断精确度低、投入高回报差甚至信任缺失等严重问题。也正是因为这些精准高质量数据难以获得,吸引了一大波AI创业公司蜂拥而入医疗影像市场淘金。

事实上,普通的医疗影像数据可以说遍地都是,但医学上很多疾病数据实际上是很少的。某业内资深人士表示,“一家医疗单位可能仅有一两百病例符合标准,甚至可以说没有一家医院敢说自己拥有几千例这样的符合标准的图像数据。可能一家医院有数万病例,但基于不同的疾病、检查方式、研究目的区分之后,数据一下子就会变得很少。医疗数据不像购物那么简单,医疗数据很多是不确定的,很难打通,这种情况下,具备完整信息的病人资料就尤其宝贵。拿肺癌或其他肿瘤来说,在大医院,满足要求的可能只有10%-20%,这已经算不错的;在二甲等地方医院,很多病人做了检查之后,就去上级医院看病去了,有完整资料的病人可能只有1%-2%。”

正是因为缺乏有效数据的训练,使得如今的医疗机构利用AI来做医疗影像筛查颇具成本压力。向军表示:“现在,能看的病不多是AI面临的一个很大的问题。比如一个放射科医生能看100种病,可能AI现在在其中7种、8种病上已经比医生看得更出色,但是还有剩下的92、93种病它其实是无能为力的。所以,真正要达到解决问题,彻底降低医生的负担,减少对医生的数量需求,应该说现在还远远没有到这个时候。”

这也就会出现医疗机构还得专门雇一个专业医生,并摊付额外的成本的现状。此时,究竟AI对于医疗机构到底是负担还是帮衬,值得商榷,向军进一步补充到:“所以现在很多AI医疗影像设备放在医院其实是吃亏的,如何将其变成一个刚需是需要考虑的问题。如果全中国的‘AI+医疗公司’能够形成联盟,大家可以相互分工,各有所长,而不是都做同一件事情,最后形成某种意义上技术共享,达成一个真正意义上的医院不需要再雇佣DR医生的水平,这就变成刚需了。”

不过,左盼莉认为这种有效数据的缺乏可以通过做大量数据标注的工作来解决。很多医疗图像数据并不是简单的零或者一,而是需要做经验的判断,通过有效标注,很多看似无用的数据几乎也都能够变成有效数据,但是,数据标注还是现阶段一个比较大的问题,她表示:“因为AI做算法的第一要求就是数据标注的得是完全正确的,所以现在各种方式,包括算法如何去解决标错的问题,以及标注本身,业内都有在进行讨论和规划。在标注问题上,我们也开了各种各样的讨论会,医生之间的观点比较一致,但医生在数据标注完之后可能还会有三盲五盲的问题,后期我们也还需要再把相对一致性的东西挑出来,以及继续深入去讨论和解决。”

为辅助医疗机构解决数据标注这一大问题,汇医慧影打造了全周期的AI平台,左盼莉表示:“我们的全周期AI平台目前基本上实现了在临床过程中医生可以去使用人工智能技术去做辅助诊断,在诊断过程当中平台可以生成结果化的报告设计,让数据比之前随便写的报告更加规范化,这些数据到数据银行,数据银行会提供一些标注工具,让它的数据更加规范清晰,然后再转回到我们的算法平台。目前,这个算法平台有一部分现在已经开放给医生使用,而且算法平台会根据图像不断产生各种各样算法模型出来,再经过临床验证以后,它可以再次恢复到临床使用场景,所以它是一个数据和临床应用的全周期。”

做这样全周期的数据管理,左盼莉表示前期需要花相当大的工夫:“刚开始,我们基本上是在电脑上拿文件夹管理所有数据,但是如何做到标注一审、二审,以及做到精标准的数据库?所以,为了管理数据,我们开发了一整套数据管理平台,为我们自己所用,并开放给医院使用,在上面针对影像开发了一些比较方便的自动化标注工具。然后,整个数据装台我们在信息化上可以说做的比很多初创企业会更多一点,基本上采用分布式的NoSQL网关,进而使得整个系统在安全上和高病发处理上能够真正在医院场景上用起来。”不过,通过自动化标注工具标注之后的数据,是否能够达到比人为标注更高比例的精准度,仍是目前行业攻坚的重要难题。

总之,统一的标准与有效的数据,是当前摆在AI医疗影像技术市场化面前的两座大山。要彻底解决标准化问题,编者认为国家有关部门的推动仅仅只能起到带头作用,真正要落实到商业化甚至民用化,仍然需要国内各大主要医疗机构之间,医疗机构和专业AI算法提供商之间进行更深入且透彻的交流与合作,在解决各方的见解和专业性冲突之余,弥合各自的商业化矛盾,进而推进中国AI医疗影像技术向标准化迈出关键一步;当然,标准化之后,行业也将正式走上“数据竞争”之路,这也将十分考验AI公司与专业医疗机构之间的合作密切程度,以及各自在市场化方面的取舍。为此,双方除了需要在各自领域打造技术和资源优势外,更重要的是在商业化目标上达成一致,才能在竞争日趋激烈的AI医疗影像市场渐行渐远。



阅读原文 阅读 941
投诉
广告

京ICP备12024388号-2 © 1997-2015 连接网版权所有