复旦大学科研团队证实ctDNA甲基化筛查技术可实现血液中的肿瘤“信号”的“早发现”

北京时间7月21日晚,《自然·通讯》(Nature Communication)发表了由我院执行院长陈兴栋青年研究员等领衔的科研团队所作的最新研究成果:“血液无创检测可以比常规诊断提前四年发现癌症(Non-invasive early detection of cancer four years before conventional diagnosis using a blood test)”。 科研人员对复旦大学牵头建设的泰州队列的部分血液样本进行了长期、系统的癌症早期检测研究。研究发现:对于结直肠癌、食管癌、肝癌、肺癌和胃癌等5种常见恶性肿瘤,在达到现有临床确诊金标准之前,甚至在病人出现自觉症状前,早期的癌症信号——微量肿瘤甲基化就存在于血液循环之中,并可以被无创检测。利用由复旦校友企业鹍远基因原创研发的ctDNA甲基化多癌筛查技术PanSeer方法,陈兴栋团队在泰州队列的血样中实现了比临床诊断提前4年发现血液中的微量肿瘤甲基化信号。

 这一最新研究成果具有重要的科研与健康意义,证实了通过提高检测技术的灵敏度能够更早的发现肿瘤标志物,从而实现有效的对癌症早期筛查。

当前,恶性肿瘤的发病率和死亡率呈逐年上升的趋势,已成为全球人类主要的疾病负担之一。与早期肿瘤相比,晚期肿瘤由于不能通过手术切除,缺乏有效的治疗方案,平均5年生存率仅为26%,而早期肿瘤患者的5年生存率可达91%。因此,实现肿瘤的“早发现”,可帮助患者赢得治疗时间,有效提高治愈率。但是,要对早期肿瘤检测和筛查进行验证和研究,不仅仅需要高效、灵敏的技术,更关键的是需要对肿瘤患者在确诊前即进行血液和生物样本采样。这就决定了,基于已有的肿瘤医院确诊病例样本库无法严格证明一个新早期筛查技术能够超越当前的临床标准。此时,就需要有大型、长期开展科研活动的人群队列来支撑科学家们的探索活动。

此次发表的研究成果,纳入了复旦自2007年起牵头建设的“泰州队列”中191个在采样时间点1-4年后确诊肿瘤的病人血液样本,和223个在当地医院确诊后采集的肿瘤病人血样,并遵循严格的1:1匹配原则,选取414个随访超过10年且未被诊断为肿瘤的病人样本作为对照人群。

 开展研究的过程中,校企科研团队融合生命科学和大数据科学多学科手段,基于ctDNA甲基化特质设计了一套机器学习方法。为严格控制大数据分析中常见的过拟合隐患,采用计算样本中每个靶基因组区域的平均甲基化水平和集合logistic回归(LR)分类器的组合,并充分考虑大量的干扰因素,以完成区分健康患者与癌症患者的分类模型搭建。该分类器在训练集中的特异性为94.7%,对确诊后采集的病人样本以及未确诊之前采集的样本分别达到88% 和91% 的敏感性。在一个独立的测试样本集中,该研究团队在207个健康对照样本重现96%的特异性的前提下,在113个确诊后采集的病人样本上达到了88%的敏感性(表1,图1B-D)。接下来,在98名未确诊之前1-4年采集的样本中PanSeer技术达到了95%的检测敏感性(表1,图2B)。

表1 PanSeer®甲基化肿瘤早筛性能 ▲

研究发现,这一中国原创技术对结直肠癌、食管癌、肝癌、肺癌和胃癌等5个不同癌种的检测敏感性在确诊前不同时间采集的血样相似(图1E-F)。这说明癌症信号在病症发展早期、甚至在无症状未确诊的若干年前就会存在于血液中。利用泰州前瞻性队列的样本,复旦研究团队在严格意义上证明DNA甲基化测序能够比传统诊断方法更早地发现癌症。

图1 PanSeer®分析结果▲

所有呈现的结果仅使用测试集样本

点代表logistic回归(LR)得分


说 明

A、PanSeer®分析中接收算子特征曲线(ROC)和曲线下面积(AUC)值。红星表示从训练集导出的截止值。

B、确诊前患者样本的LR评分。

C、按癌症分期的确诊患者样本LR评分。

D、按组织来源确诊患者样本LR评分。

E、按癌症分期的确诊前患者样本LR评分。

F、按组织来源(癌种)的确诊前患者样本LR评分。


本次研究的通讯作者、中科院院士、泰州健康科学研究院院长金力表示,在精准医学和大数据时代的今天, 大型人群队列研究成为生物医学研究的主要支撑平台之一。泰州队列已建成世界领先的单一地区人群队列,拥有包括20万人、近200万份生物样本和PB级数据库的高质量队列资源。此次利用PanSeer技术和泰州队列资源合作进行的研究至少证明癌症早期筛查可以通过无创血液检测完成,便于对无症状癌症易感人群的“早发现”继而“早干预”,具有十分重要的应用价值。这也例证了泰州队列在开展生命科学与精准医学研究上的长远价值。

研究第一作者、泰州健康科学研究院执行院长陈兴栋青年研究员指出,开发针对高风险人群或社区人群的癌症早期筛选检测,成本是确保检测可用性和受众依从性的关键因素。目前国外的一些类似多癌早期筛查研究的检测方法成本很高。而此次研究采用的我国原创技术PanSeer是为癌症早筛特定开发,仅检测目标明确、数量有限的基因组区域的甲基化异常,仅需从单管血液中取样少量DNA即可,具备了作为潜在一线癌症早筛手段的有效性和经济性。

本研究共同通讯作者、鹍远基因公司联合创始人兼首席技术官刘蕊博士认为,该研究在技术上的最大的技术突破是利用半靶向PCR技术构建血浆游离DNA靶向测序文库的方法,大幅度提高甲基化靶点的富集效率,解决了早期癌症患者血浆中ctDNA稀少、常规方法DNA丢失率高、检测灵敏度受限等问题。刘蕊博士介绍到,机器学习技术广泛应用于大数据处理中,是利用成百上千个基因组区域进行综合评分,所以要特别注意过拟合的情况。PanSeer分析通过层层质控筛选,最终综合评估477个基因组区域的10,613个CpG位点,高深度测序,单分子标记去除杂音,从而获得较高的分析准确性。未来,如对PanSeer多癌筛查技术进一步优化,增加癌种,结合多组学靶标,进行扩大样本的前瞻性多中心研究,有望让该技术更加成熟、更早投入实际应用。

复旦大学泰州健康科学研究院

复旦大学泰州健康科学研究院是2007年在泰州市人民政府领导下,由复旦大学与泰州市医药高新技术产业园共同建立。研究院是以促进中国人群健康为目的的事业型科研机构,以危害我国人群的重大慢性疾病为主要研究目的,以泰州人群为主要研究对象,进行前瞻性健康人群大型队列建设,研究遗传因素、环境因素、环境-遗传交互作用与重大慢性疾病的关系,并提出疾病预防和治疗的对策和手段,目的是建设一个使泰州人群受益,为转化医学服务,促进中国人群健康的公共科研平台。

目前已建立20万自然人群队列——泰州队列,形成了具有优势的、国际领先的人群资源,并建成了人类遗传资源平台和健康大数据平台,建立了我国最大的单一地区生物样本库,累计了近200万例的人群标本,可用于生物标志物的筛选,下一步向千万级的方向发展,同时也累计了PB级的健康医疗大数据资源,并开发了一系列大型队列建设的关键技术、标准和规范。在国内外学术界、科技界具有了一定的影响力,泰州队列也被纳入国家“十三五”精准医学研究计划,成为了中国百万人群队列计划的主要组成部分。

近年来,复旦大学和泰州市科技合作升级,进一步扩大建设复旦大学泰州健康科学研究院,以建立“一队列两平台”为主要架构,成为集原创研究、科技服务、技术孵化和产业转化多种功能的新型机构集群。一方面,通过政府进一步的投入和复旦大学注入更多的创新资源和人才团队,增强泰州队列的能力,进一步提高泰州市和中国生物医药科技自主创新和大健康产业发展的支撑能力。另一方面,打造健康大数据和人类遗传资源库两个共享平台,推动核心技术研发与引进,为泰州国家级生物医药产业高新区的建设提供强有力支撑。未来希望通过进一步建设泰州队列、大数据平台等基础设施,使泰州队列成为国家精准医学的核心布局和创新源泉,为中国的精准医学发展提供重要的支撑。

PanSeer®技术与鹍远基因

PanSeer®技术是由鹍远原创研发的国际专利技术,特别针对循环血液中低量的游离肿瘤DNA甲基化信号的高通量高效捕获富集,精准定量关联分析微量的肿瘤信号存在和溯源而开发。PanSeer®利用高效连接,单端瞄定,和单分子标记物的组合,有效克服DNA起始量低,传统NGS方法流程复杂,模版丢失情况严重等困难,使得此技术可以成功的应用在早期癌症病人样本中(ctDNA含量极低)。PanSeer®相对性的新型数据分析的方法,利用 ctDNA 甲基化片段化信号,关联紧密度,和单倍型量化指标,使得检出信号更灵敏更特异,适合 ctDNA 的应用场景。

鹍远基因成立于2014年,由著名科学家高远教授、张鹍教授及CEO张江立、COO刘强、CTO刘蕊博士共同创立。公司致力于新一代测序技术的研发和临床应用,开发肿瘤和遗传疾病的系列基因检测解决方案,尤其是基于专利甲基化测序技术的肿瘤无创早期筛查和诊断技术的开发和应用。鹍远始终走在生命科学和生物技术的前沿,目前拥有上海和圣地亚哥两个研发中心,七十余位高学历科研团队,国际和国内专利数十项。依托深厚的学术积淀和丰富的临床实践经验,鹍远与国内外上百家科研机构及大型医院合作,提供高发癌症的风险评估、早期筛查和肿瘤药物伴随诊断的全周期服务,每年服务数十万患者。通过不断推出的先进技术和创新产品,以及积累的大样本和大数据,鹍远已经成为中国液体活检和肿瘤早筛领域的领军企业。