老年|远毅资本唐轶男:DRG支付推行后,AI病案质控将成为「黄金赛道」( 七 )
本文插图
我们只看最后一句话 , 里面不包含任何一医学的专业术语 , 我们感受一下:患者病来 , 患者神志清 , 精神可 , 睡眠可 , 二便无殊 , 体重无明显变化 。 如果直接把其他领域训练出来的NLP算法 , 通过简单的调参就用于医疗 , 结果的准确度可想而知 。
本文插图
第二部分 , 命名实体识别 , 因为医学语言专业的属性很强 , 存在大量的专业术语 , 性能可靠性要求又极高 。
行业里有很多医疗NLP领域的先行者 , 最早的核心应用场景定位在科研 。 从技术的角度来看 , 先做科研是对的 。 因为技术难度相对较小 。 科研的应用场景很好理解 , 就是从完整的病案中抽取一部分的信息来进行分析和整理 。 科研应用并不需要对病案进行100%的后结构化 , 只需从中挑选部分的信息 。
因此 , 科研NLP的标签类型在8-20类即可满足要求 , 同时会有大量的文本不需要被识别 。
但是医疗质控的应用需求又如何呢?
本文插图
单单说现病史的质控 , 就需要把一个症状的描述拆分到非常之细的程度:呕吐的性状是不是喷射状 , 以及内容物的差别 , 都会影响主诊医生对诊断大方向的判别 , 这些都需要被算法进行识别 。
病案质控是寻找医生在病案书写中的缺陷 , 其前提就是 , 算法必须有能力对病人进行一个100%的后结构化 。 如果没有完整理解全部的病案 , 又哪来的自信 , 拍着胸脯说医生你写错了呢 。
所以 , 质控NLP算法的分词颗粒度和命名实体识别的标签类别要远远超过科研NLP的要求 。
本文插图
第三部分 , 语义关联分析提取 。
一个真正智能的算法 , 必须能够容忍真实病案中出现的各种各样的问题:同义词、错别字、丢字造字、语法错误等等 , 不能遇到问题的时候就卡壳 。 算法需要和人一样能够识别、容忍还有理解 。
作为投资人 , 我们经常听到 , 某个医疗AI项目说自己的算法是最好、最精准的 , 因为用于训练算法的数据都是用标准流程生产出来的 。 我并不是很认同这个观点 。
我认为 , 一个能广泛应用于真实世界的产品 , 必须要通过技术来解决这些不完美 。 一个在真空环境中训练出来的算法 , 不可能被临床广泛接受 。
本文插图
下面这个是关联分析提取后的结果 , 找到标签间的逻辑关系后结构化完成的 。
AI病案质控是一个典型的AI产品 , 而不是一个信息化的产品 , 所有底层算法和产品架构不可能通过一、两个医院项目就能打磨完成 。 而要在产品研发的初期 , 根据应用场景的任务目标来打造专用的语料库 , 进行算法的训练和迭代 。 因此 , 研发周期会比较长 。
- 新华网|新研究:电流刺激无助于改善老年人认知能力
- 央视|危险!陕西汉中发生一起老年代步车坠崖事故
- 证券市场红周刊|海银资本王煜全:反垄断对平台型科技巨头长期影响可谓“九牛一毛”
- 韩剧集合处|晨溪资本联袂中信书店, 共谋金融文化跨界合作
- 小飞人|创办中国工业·资本对接大会 青企峰会构建全链条生态服务体系
- 北青网综合|老年人怕什么?这3个问题要做好防范
- 北青网综合|中老年人这样调整生活节奏,长寿将会向你靠近
- 北青网综合|老年人的5大健康饮食原则,不妨牢记!
- 包商银行|史上首例!包商银行65亿元二级资本债全额减记
- 包商银行股份有限公司|史上首次!包商银行65亿二级资本债全额减记 因发生“无法生存触发事件”
