AI医疗界的3大乱象以及如何评价医学人工智能的成果?
雷锋网(公众号:雷锋网)注:本文作者代号HHH,目前为一家人工智能医疗创业公司的CEO,有10多年硅谷的高科技公司的工作经历(Google, Cisco等),斯坦福商学院Sloan Fellow。
With machine learning situated at the peak of inflated expectations, we can soften a subsequent crash into a “trough of disillusionment” by fostering a stronger appreciation of the technology’s capabilities and limitations.
今年6月底的《新英格兰》刊出了一篇观点文章《Machine Learning and Prediction in Medicine — Beyond the Peak of Inflated Expectations》,《机器学习和医学预测--远超过高期望的峰值》,文章的批判方法算是很给深度学习这个新工具留面子了。
这里插播一句,我最近接触了一些自称主要关注医疗方向的投资人和创业者,发现有些人居然不知道这个地球上影响因子排名前几的临床医学期刊。《科学》杂志主刊2016年影响因子37.205分,《自然》主刊是40.137,而《新英格兰》是72.406分。当然,有可能这些人也不知道什么叫影响因子。
这篇文章借用了Gartner的技术成熟度曲线Hype Cycle,讲述现在对于医疗界来说深度学习处于过高期望的峰值(Peak of Inflated Expectations)时期,希望我们正确的理解这项技术的能力和局限性,继而进入幻想破灭的底谷期 (Trough of Disillusionment),而不是彻底性的崩溃,然后才有然后:稳步爬升的光明期 (Slope of Enlightenment)和实质生产的高峰期 (Plateau of Productivity)。
文章用严谨和隐晦的语言,指出了现在医学人工智能界做的一些不靠谱、不合医学逻辑和没有临床价值的事情。回观国内市场,这些不靠谱、不合医学逻辑和没有临床价值的事情反而愈演愈烈,耗费了大量的资本和医疗资源,可谓几大乱象。
一、乐此不疲的人机大赛
医学是讲证据的学科,如何证明一项临床成果的先进性,实用性和稳定性,是个学问。
也许是阿尔法狗给大家带了个头儿,觉得用人工智能PK人类只要是平了或者赢了就是证据,于是大江南北人机大赛屡见不鲜:《人工智能PK最强医脑系列大赛》、《首届人机读片竞技大赛召开》、《AI-医师读片竞赛》、《XXX达到/超过人类医生的水平》等等,伴随着这些大赛的,往往是一系列的发布会。一共就十几个甚至几个医生参与,一共就几百张甚至几十张医学影像,最后的百分数结果保留至少四位有效数字,能够证明毛线?且不说是否有为了发布会安排结果的嫌疑,单就医生的水平、状态,数据随机性和广泛性都是论证过程中不堪一击的节点,不能细想不可追问。
二、乐于做不可证伪的预测
医学是讲证据的学科,可是总有一些问题是没有办法证明对错的。
最典型的就是做个体诊断的预测。预测,根据特征人群的患病概率来指导筛查是有价值的,但是对于个体诊断进行的预测是无法证伪也是不科学的。比如,预测特定的个体将有80%的概率患肺癌,和预测30%有本质区别吗?得肺癌可以说明前者更准吗,不得肺癌可以说明后者更准吗,没得肺癌可以证明明年不得吗?深度学习这个工具有一个所谓必杀技:有问必答。别问它怎么得出来的,它声称是有“像人脑一样的一套神经元思考”出来的。作为一个拟合函数,深度学习一定是有输入就有输出的,但是对于输出的结果,如果没有金标准检验,就方便做文章收智商税。《新英格兰》的文章中还提及另一种不可证伪,叫做本身就是一句废话,也就是浅显的道理。比如用人工智能来判断一个高龄且有各种病史的患者有极高的手术风险。临床需求是看哪种诊断或治疗方案更有用,而不是看谁说得废话更多。
三、脱离临床指南,幻想被树上掉下来的苹果砸到
医学是讲证据的学科,可靠的证据形成了临床指南,可靠的证据在推动临床指南的发展。
也许现在计算机的进步让更多的数据可以被利用起来来进行综合判断,但是在这些判断标准进入临床指南之前,都是科研探索的性质。《新英格兰》的观点文章中明确的提到了这种行为,这种没有已经探明的医学逻辑支撑,通过堆砌更多维度的数据妄想有所发现的行为,最终会陷于蝴蝶效应带来的困境之中。我国80年代曾有过大批群众激昂热情去攻克”哥德巴赫猜想“,当时的数学家看待这些群众的努力,也许就像现在医学研究领域的科学家在看大数据工程师们。听说全国有几百家做基因检测服务的公司,他们中的很多给投资人讲得故事就是拼命收集数据,数据堆得多了,深度学习自然就会发现规律。“读书百遍,其义自见”吗?科研工作,还是留给那些受过科学训练的人们吧。
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
花旗预计“每卖一台SU7亏6800元” 小米高管回应:信息偏差较大
苹果将允许用户和第三方维修商使用二手正品零部件维修iPhone
苹果市值一夜暴涨8113亿元 据称拟升级整个Mac产品线
余承东调侃小米SU7原装手机支架设计?雷军发文回应
OpenAI超蚂蚁集团 胡润榜单上的“中国VS美国”
智己汽车因标注错误发致歉函 但致歉函中也有错误
特斯拉3月份向国内用户交付近6.24万辆电动汽车 环比翻番但同比有下滑
网易暴雪官宣“复合” 暴雪国服今夏回归
马云阿里内网发文:《致改革 致创新》
更多
- 昆仑万维:天工音乐大模型今日公测
- 集齐Claude 3全家桶,Anthropic Claude 3 Opus基础模型在Amazon Bedrock上正式可用
- 发布全新电动品牌“烨” 本田中国“夹缝中求生存”
- OpenAI、蚂蚁集团、谷歌等联合编制的大模型安全国际标准正式发布
- 极越汽车法务部回应“员工买小米汽车被开除”:系上班时间从事与公司事务无关行为
- 中国AIGC产业峰会今日举行,微软阿里商汤等十余位玩家共探AI新应用
- 小度推出全球首个AI原生操作系统DuerOS X, “最强大脑”正式上线
- 中国AIGC产业峰会今日举行,中国AIGC应用全景图谱首次发布
- 12306回应五一车票秒没:中间站按比例放票 建议尽早候补
- 极越回应员工因购买小米 SU7 被辞退
更多
- SK海力士Q1营收有望超过12万亿韩元 营业利润重回万亿韩元之上
- 消息称苹果有意在印度生产iPhone摄像头部件 同当地厂商有过接触
- 自裁员消息出现以来 特斯拉市值已蒸发超过3000亿元
- 坐实裁员?马斯克透露正精简特斯拉销售与交付体系
- 一季度全球智能手机出货近2.9亿部 小米传音出货量同比均有大增
- 特斯拉一季度在美国新销售电动汽车中占比过半 仅Model Y就占35.4%
- 机构数据显示苹果iPhone今年一季度出货5010万部 同比下滑近10%
- 特斯拉再失两名重要高管 其中一人是高级副总裁已效力18年
- 人工智能等领域需求增长推动 3月份韩国半导体出口额增至117亿美元
- OpenAI宣布在东京设立亚洲首个办事处 将推出日语优化GPT-4定制模型