#癌症#北大肿瘤医院柯杨教授团队基于医保系统大数据构建“癌症发病监测”新模式


2020年4月9日 , 《柳叶刀》子刊EClinicalMedicine正式全文刊发了北京大学肿瘤医院遗传学研究室柯杨教授课题组题为“Estimating cancer incidence based on claims data from medical insurance systems in two areas lacking cancer registries in China”的研究论文 。
该研究创新性地利用南、北方两地区2012-2019年医保系统报销数据 , 专门针对“癌症新发病例识别”构建了一整套数据脱敏、清洗、质控、判定、分析、报告的流程标准 , 最终通过建立MIS-CASS(Medical-Insurance-System-based Cancer Surveillance System)模式对两地癌症发病率进行动态监测与报告 。 依托该模式 , 首次报告了两地2014-2018年度恶性肿瘤发病专率、发病顺位及主要瘤种的时间变化趋势 , 为明确地方癌症疾病负担 , 因地制宜地建立健全恶性肿瘤防控体系提供了科学依据 , 也从根本上结束了两地区无准确癌症发病数据的历史 。
该报告第一作者分别为柯杨教授团队和来自于汕头大学医学院附属肿瘤医院、河南省滑县医保局合作团队的骨干成员 , 团队负责人柯杨教授与何忠虎研究员为共同通讯作者 。
癌症是全球第二大死因 , 对人类的健康构成严重威胁 。 我国人口基数庞大 , 老龄化进程不断加快 , 癌症防控工作也面临巨大挑战 。 准确、实时的恶性肿瘤发病数据可为防控相关的政策制定、资源配置和科技项目实施与效果评估等提供重要依据 。 肿瘤发病数据的获得主要通过“肿瘤登记”实现 , 其中最理想的模式为“基于人群的肿瘤登记体系(Population-based Cancer Registry , PBCR)” 。
我国现行的肿瘤登记工作可追溯到上世纪50年代末60年代初 。 历经几十年发展 , “从无到有”、“从弱到强” , 为相关工作的开展提供了关键的基础数据 。 然而 , 受限于“基于监测哨点开展、定点医院人工填报”的主要形式 , 目前我国肿瘤发病登记工作的发展遇到挑战 。 其中主要包括:肿瘤登记点数量不足和分布不均衡;肿瘤登记数据深度和广度不足;很难在现有模式下建立真正覆盖全人群的肿瘤监测系统 。 同时 , 对上报数据的采集、补充、质控需要较长周期 , 导致我国肿瘤发病年报通常会滞后3年发布[1-3] 。
河南省滑县与广东省汕头市合计在籍人口约700万人 。 近十年以来 , 各项医保系统的总参保比例分别稳定在99%及90%以上 。 两地区过去一直被认为是食管癌高发区 , 但目前尚无国家肿瘤登记系统覆盖 , 因此实际的癌症负担及食管癌发病水平仍不明确 , 无法有针对性地制定并实施肿瘤防控计划 。
过去十余年 , 柯杨教授课题组在我国太行山食管癌高发区开展了多项大规模前瞻性人群研究 。 在长期的队列随访工作中 , 课题组探索出利用“医保报销数据”追踪肿瘤新发病例的工作模式 。 经比较性研究评估 , 该模式对新发癌症病例捕捉的灵敏度高达96% , 特异度接近100%[4] 。 在此基础上 , 该团队进一步与河南省滑县和广东省汕头市政府有关部门与医疗机构建立深度合作 , 在高度重视数据安全与隐私保护的基础上 , 创新性地基于医保系统的医疗费用报销与疾病诊断数据 , 建立了一套标准化的数据清理流程和质控标准 , 研发了医保系统数据挖掘的相关算法(已申报相关发明专利) , 实证性构建了南、北方两个试点地区的肿瘤发病监测系统 。 对当地全瘤种的癌症发病数据及其流行分布特征、时间趋势等进行了深入分析与报告 , 为两地区明确癌症疾病谱特征及相关负担、有针对性地建立并完善癌症防控工作策略提供了详实的数据 。
#癌症#北大肿瘤医院柯杨教授团队基于医保系统大数据构建“癌症发病监测”新模式
本文插图
2012-2018年河南省滑县与广东省汕头市参保全人群的年龄分布(高参保率及稳定、详实的人口分布数据使MIS-CASS实现“全人群覆盖”)