以阿尔兹海默病(AD)为代表的痴呆症(Dementia)潜伏期往往长达数十年,等到出现症状时再治疗常常为时已晚。科学家们正在努力寻找准确便捷的检测方式,对痴呆症进行早期筛查和防治。近日,一支来自上海的科学家团队通过血液标志物建立了一种预测痴呆症的模型,或可提前15年精准预测。
这项研究于当地时间2024年2月12日发表于《自然·衰老》(Nature Aging)杂志上,标题为《血浆蛋白质组学预测健康成年人未来痴呆风险》(Plasma proteomic profiles predict future dementia in healthy adults)。作者是来自复旦大学附属华山医院神经内科的郁金泰教授团队,以及复旦大学类脑智能科学与技术冯建峰教授/程炜研究员团队。该研究被《自然》杂志社选为研究亮点(Highlight),并在《自然》官网头条配发新闻《Early dementia diagnosis: blood proteins reveal at-risk people》。
这项研究使用迄今为止最大规模的基于社区队列的蛋白质组学数据。基于英国生物银行(UK Biobank)数据库,该研究对52645名非痴呆成年人的血液数据进行了跨度超过14年的追踪挖掘。在随访过程中,这些参与者中有1417位被诊断为新发全因痴呆(ACD),691位被诊断为新发阿尔兹海默病(AD),285位被诊断为新发血管性痴呆(VaD)。
通过对这些患者血液数据中的1463种血浆蛋白质数据进行分析,研究者们发现了对痴呆预测极具价值的三种血浆生物标志物,分别是GFAP(胶质纤维酸性蛋白)、NEFL(神经纤维丝轻链蛋白)和GDF15(生长/分化因子15)。
研究者们通过机器学习算法分析后发现,在这一千多种蛋白质中,三种蛋白质含量的变化与患痴呆症的可能性之间关系最紧密。他们随后用这些蛋白质在血液中的含量以及年龄、性别等人口因素建立了诊断痴呆症的模型并加以检验,发现可以很好地预测未来10余年痴呆发病的风险。
该研究还发现,这些蛋白质水平较高的受试者患痴呆的风险大大增加。例如,GFAP基线水平较高的人未来患痴呆的几率是GFAP基线水平较低的人的2.32倍。此外,样本中的患者血浆GFAP、NEFL和GDF15水平早在痴呆症诊断前10余年就明显偏离了正常值。
目前关于痴呆症血液标志物的研究屡屡出新,“一滴血”预测痴呆症似乎越来越近。近日,澎湃科技专访本研究的共同通讯作者郁金泰教授,请他介绍这项研究的数据和方法上的特点,以及对痴呆症血液检测发展趋势的看法。
【对话】
基于开放数据库的蛋白质组学与人工智能的交叉研究
澎湃科技:能否介绍一下新发全因痴呆(ACD)、阿尔兹海默病(AD)与新发血管性痴呆(VaD)之间的关系?为什么选取它们进行研究?
郁金泰(复旦大学附属华山医院神经内科主任医师):全因痴呆(ACD)并不是单一的指一种疾病,其包括各种类型的痴呆。阿尔兹海默病(AD)是最常见的痴呆类型,占所有痴呆的60%-80%。血管性痴呆(VaD)在临床上一般占所有痴呆类型的12%-20%,仅次于AD。除了选取ACD为主要结局,本研究还选取了两种最为常见的痴呆类型——AD和VaD进行研究。
澎湃科技:之前是否有研究表明GFAP、NEFL与GDF15这三种蛋白质与痴呆的相关性?很多研究在关注tau蛋白或Aβ(二者均被认为是与阿尔兹海默病密切相关的蛋白质)等特异性蛋白作为血浆标志物的可能性,本研究是否也检验了它们?
郁金泰:NEFL与AD和VaD的关联,以及GFAP和GDF15与AD的关联已经在之前的研究中被报道,并且已报道的关联方向与我们研究的结果一致。GFAP和GDF15与VaD的关联是本研究的新发现。尽管我们的研究提供了对血浆蛋白相对全面的评估,但并非所有的人类蛋白质组数据都能被捕获到,由于缺乏血浆Aβ和tau相关蛋白的检测数据,这限制了我们研究它们对痴呆的预测价值。
澎湃科技:研究采用迄今为止全球最大规模的基于社区队列的蛋白质组学数据,能否介绍一下这些数据?
郁金泰:本研究依托于英国生物银行(UK Biobank)数据库。UK Biobank是一个大型前瞻性的基于社区人群的生物医学数据库,共收集了英国各地年龄在40~69岁之间的50多万例志愿者数据信息,包括志愿者的基本人口学特征、生活方式、身体测量、疾病及用药信息、基因、多模态影像数据及生物样本相关数据。
这项研究计划的时间跨度从2006年延续至今,并对人群的健康和医疗状况信息进行长期追踪随访。UK Biobank数据库不仅定期增加额外数据和更新,而且对全球符合有关伦理和科学标准的研究人员开放访问,从而促成多项改善人类健康新项目的产生。
受试者的血液样本均在基线入组时被采集到EDTA抗凝管中,离心分离得到血浆后,将上清液储存在-80℃冰箱,直至用于后续的血液蛋白组学分析。UK Biobank在近期释放了对54306名参与者的血浆蛋白质组学分析的数据。采用Olink邻位延伸分析技术(Proximity Extension Assay,PEA)对血浆蛋白浓度进行统一量化,该方法针对每个待检蛋白设计一对抗体,抗体上偶联有特定的DNA单链标记,抗体对结合目标蛋白后,处于邻位的两条DNA单链可互补结合并延伸形成双链DNA模板,通过qPCR/NGS技术快速完成定量分析。
该技术突破传统蛋白组学检测技术灵敏度受限、特异性较低、检测动态范围受限、样本消耗量大、通量低的困难,为理解复杂的、实时的人体生物学,助力精准医学、转化医学、药物研发等提供创新的蛋白组学检测方案。
澎湃科技:研究使用了人工智能算法对蛋白质组学进行了分析,能否介绍一下?
郁金泰:本研究采用的人工智能算法为轻量级梯度提升机(light gradient boosting machine,LGBM)机器学习算法。LightGBM是一种基于梯度提升框架的机器学习算法,使用LightGBM模型计算SHAP(Shapley Additive exPlanations)值,并使用shapviz包中的可视化函数对模型的解释结果进行展示。SHAP值提供了对模型预测输出的解释,以及每个特征对于预测结果的贡献程度。
与传统的梯度提升方法相比,LightGBM具有高效性、快速、准确性、支持并行化、可扩展性等优势。LightGBM的作用是在大规模数据集上构建高效、快速、准确的梯度提升模型。其重要意义在于提供了强大的工具,能够更好处理复杂的实际问题。
澎湃科技:你的团队于2022年9月发表在《柳叶刀》子刊《电子临床医学》的研究采取了十个人口-血液指标建立了一种痴呆风险预测模型UKB-DRP。这次的模型采用血浆蛋白与少量人口指标联合,但在长时段ROC(受试者感受性曲线)中的表现似乎没有与UKB-DRP拉开很大差距。本次研究模型的优势主要在哪里?
郁金泰:本研究的主要优势在于创新的数据驱动的蛋白质组学策略,基于迄今为止最大的前瞻性的基于社区的长期纵向随访队列,我们从1463个血浆蛋白中发现了预测痴呆发病的重要血浆生物标志物。联合单个血浆蛋白与基本人口学指标,即可以很好地预测未来痴呆的发病风险。
相比之前采取十个指标所建立的UKB-DRP模型,本次研究模型更加简便、易获取,也更易于普及,不仅可以很好预测短期痴呆发病风险,而且对十余年后的痴呆发病风险也能进行理想的预测。
外周血检测痴呆,准确性有待验证
澎湃科技:你怎么看AD相关早期血液诊断方面的研究现状?
郁金泰:近年来血液生物标志物在阿尔兹海默病(AD)诊断中的作用备受关注,随着具有优异诊断性能的血浆生物标志物被开发出来并得到了临床验证,AD的生物学诊断也变得普遍可行,有望通过大范围的临床应用来降低诊断成本。
虽然很多医院已经开展了相应的外周血检测,但是准确性依旧待察,更多的还是在研究阶段,但随着2023年7月AD协会国际会议(AAIC)公布的最新的AD诊断新指南的推进,这些实验室诊断也有望迎来快速发展。期待在未来,血液生物标志物可应用于AD病理的早期检测,缩短诊疗时间,成为AD转诊路径中重要的工具。
目前基于生物标志物的AD精准诊断和分期从研究到临床的过渡已成趋势,但血液学生物标志物截断值的标准化仍然是目前研究的难点,划定具体的血液学生物标志物的异常截断值并在不同临床队列中进行验证是很有必要的。
澎湃科技:该研究得到国内外项目如英国生物样本库(UK Biobank)以及中国“脑科学计划”的支持,这些国内外的合作和支持是如何开展的?
郁金泰:UK Biobank数据库对全球符合有关伦理和科学标准的研究人员开放访问,从而促成多项改善人类健康新项目的产生。我们的研究得到了UK Biobank的批准,申请号为19542。中国“脑科学计划”旨在推动脑科学与类脑智能研究的发展,并符合国家“健康中国2030”的战略需要。这些国内外的项目均旨在为包括痴呆在内的神经退行性脑疾病开发有效的诊断预测和治疗方法。
来源:澎湃新闻 作者:季敬杰