研究背景:胰腺导管腺癌,通常简称为胰腺癌,其肿瘤微环境中常存在大量的致密结缔组织增生,肿瘤与间质交织,在传统影像学如CT和常规核磁上区分较困难,化疗后可能肿瘤细胞已杀死、但纤维结缔组织构成的肿瘤间质仍存在,特别是在治疗后的早期,病灶的总体大小变化可能并不明显。胰腺癌的治疗手段中化疗占重要地位,化疗可应用在新辅助治疗、辅助治疗及晚期患者姑息治疗的多种场景下,目前推荐的化疗方案包括FOLFIRINOX, 改良 FOLFIRINOX, 吉西他滨+白蛋白紫杉醇等。胰腺癌化疗后利用形态学评效可能难区分存活肿瘤与间质增生;临床常用的血清CA199评效,敏感性与特异性不足。而利用FDG PET进行胰腺癌疗效评价,由于前期研究样本量小、结论不一致,尚未广泛应用。
因此,这项探索性前瞻性研究,试图探究 FDG PET 评价的代谢缓解是否可预测胰腺癌一线化疗患者的生存,提出的假设是早期代谢应答比早期形态应答能更好预测患者总生存期(OverallSurvival, OS)。
研究方法:该研究是一项单中心、单臂、开放标签的前瞻性、探索性研究。入组活检证实为胰腺导管腺癌的患者,行一线化疗,接受18F-FDG PET/CT基线与随访评估。入组患者行三次PET/CT检查,分别为一线化疗开始前的基线PET(PET1),早期评效(PET2)与晚期评效(PET3)。完成检查后对患者继续随访,确定临床情况、治疗情况及OS。PET/CT采集与患者准备遵循EANM显像要求。研究共用到3台PET/CT仪器。根据患者体重每床位采集2-4分钟。用到两种重建方法,均为OSEM算法、2次迭代,子集数分别为8次和24次。PET/CT注射静脉造影剂以确认病灶边界,并口服阳性对比剂。重点关注的评效指标是反应代谢的SUVmax与反应肿瘤大小的病灶长径。依据应答患者与无应答患者OS的区分度,进行了样本量计算,得到总样本量为70人。应答的阈值选择结合了普适性的modifiedPERCIST(mPERCIST)与RECIST1.1的标准,并根据研究结果中各评效指标对患者OS的区分度进行一定变更,以OS中位数为界分为两组,对SUVmax与肿瘤大小进行ROC曲线绘制,以判断能最准确预测OS的阈值。根据ROC曲线的结果,SUVmax早期评效与晚期评效的下降阈值分别15%和38%,考虑指标的可重复性及方便临床应用,扩大至早期20%和晚期40%;肿瘤大小早期评效的下降阈值为13%,扩大到20%,晚期由于RECIST1.1证据充分、应用广,直接用了规定的大小下降30%。最终规定SUVmax早期下降20%、晚期下降40%为肿瘤应答,大小早期下降20%、晚期下降30%为肿瘤应答。
研究结果:
从2013-2至2019-2,共招募33名胰腺癌患者,其中28名患者完成基线PET/CT检查(PET1),PET1与PET2的中位时间间隔为3.6周(IQR3-4.3w),完成化疗程数中位2程(1-4程),其间有5位患者脱落。PET2与PET3的中位时间间隔为8.1周(IQR5.7-10.5w),完成化疗程数中位3程(1-6程),最终完成PET3检查的患者有21名。完成PET1检查的28名患者临床分期包括IB期、II期、III期与IV期,至最后一次随访,28人中23人死亡,1人失访,4人存活,一线化疗方案包括五种,平均疗程数6程(2-12程)。后续治疗方面,8名患者进行了手术,13人接受了放疗,14人接受了二线治疗。末次随访时间为2020年10月,中位随访时间14个月,中位生存期14个月(95%CI9.8-27.6mo)。
基线、早期与晚期评效的(PET1/2/3)胰腺原发灶的SUVmax与长径如下,PET1上不同SUVmax或病灶长径未发现对总生存期存在有影响。
依据评效指标下降的阈值,以SUVmax下降20%为界,进行了PET2早期评效的23人中,6人达到早期代谢应答,此6人的OS显著长于未到到早期代谢应答的17人,中位OS为36.2个月;以肿瘤长径下降20%为界,7人达到早期形态应答,早期形态应答者与未应答者的中位OS无显著差异。以SUVmax下降40%为界,进行了PET3晚期评效的21人中,10人达到晚期代谢应答,此10人的OS与未达到晚期代谢应答的11人相比有延长趋势,P=0.058以肿瘤长径下降30%为界,7人达到晚期形态应答,晚期形态应答者的OS显著长于晚期形态未应答者,中位OS为58.2个月。依据PET3上是否达到晚期代谢或形态应答,将21例患者分为代谢与形态双模态应答(5人)、代谢或形态单一模态应答(7人)与无应答(9人),三组的中位总生存期存在显著差异,亮亮比较,双模态应答者的OS显著长于无应答者,另两个比较也有延长趋势。此外,也进行了以mPERCIST中SUVmax下降30%作为代谢应答阈值的生存分析,以mPERCIST的标准,5人达到早期代谢应答,生存期有延长趋势;12人达到晚期代谢应答,晚期代谢应答者与无应答者OS差异不显著。
最后,研究得出结论:胰腺癌一线化疗早期评效SUVmax下降20%可以区分患者预后。
单看结论很有价值,在化疗约2程、4周左右进行早期评效,SUVmax下降20%阈值比PERCIST规定的30%低,如果SUV下降20%可以更早地反应治疗疗效,并与预后相关,那一方面在新药的临床研究中应用早期评效可以更早达到评估终点,同时在临床实践中对那些早期代谢未应答者,也可尝试改变治疗策略,避免部分患者在常规8-12w评效时已大幅度进展。看结论是有趣且有意义的,但一个研究结论是否需要或经得住推敲,取决于研究设计是否严谨,是否存在一些局限性。
讨论部分提到一些研究的局限性:
文章中对第三个问题没有再具体详细展开,那么患者分期对预后研究结果是否会产生影响?这篇文章中的研究设计是否还有其他不够严谨的地方?首先第一个疑问,是文中提到的入组患者肿瘤分期差异大,不同分期的胰腺癌患者预后差异很大,分期不同治疗方案也不同,IB及II期的患者无论做不做新辅助通常都可进行手术切除,而是否进行治愈性手术直接影响胰腺癌患者预后。因此胰腺癌患者间的预后差异可能不仅仅依赖于是否对一线化疗有应答,临床分期不同对预后存在影响。首先在研究开始前设置更合理的入排标准,以避免分期对预后的影响;其次如想纳入所有分期的患者,也应将肿瘤分期纳入预后分析或将患者按分期分层。
第二个疑问是患者入组后的治疗方案差异较大。入组患者一线化疗方案化疗方案、疗程数对预后是否会有影响?在化疗结束后的后续治疗,是否手术对预后是否会有影响?是否放疗对预后是否会有影响?首先要考虑分析结果时是否要纳入所有入组者,其次入组后可能对患者预后产生影响的治疗因素也可尝试纳入预后分析。
影响SUV的因素众多,涵盖患者的生物因素,采集的设备与采集参数,图像重建参数,以及图像分析。文中共用到了3台PET/CT仪器,其中mCT有TOF,另两个机器没有,迭代相同的情况下,TOF重建出的SUVmax更高,噪声更小。研究用到2种重建参数,迭代次数相同均为2次,子集数增加SUVmax会有明显增加。对研究PET评效的研究,保证每次检查间的可比性很重要;针对影响SUV的可变因素,最好的解决方案是保持每个患者每次采集都一致;如果无法保持患者间的一致,需保证每个患者每次检查间的一致性,仅用SUV变化百分比评价可较大程度减少偏差。
研究中对PET评效的应用也存在一些疑问。首先是病灶是否可评估?或者病灶是否可被选为PET评效的靶病灶?PERCIST中要求靶病灶的SULpeak>1.5×肝SULmean+2SD,以避免用摄取特别低的病灶进行评效可能过度评价病灶应答或进展。第五个疑问是仅评估胰腺原发病灶的代谢变化与大小变化,原发灶变化是否可以代表整体?病灶选择上,一方面可以规范靶病灶的选择,同时明确复查中非靶病灶/新病灶的意义;或者同时评价原发灶与转移灶的代谢或大小变化评估一致性。
第六个疑问是评效时间与化疗疗程数的差异,PET1-PET2,PET2-PET3间复查的时间间隔与疗程数差异较大,更严格地定义早期和晚期评效时间点是有必要的。
以上是阅读这篇研究文章中,产生的关于研究方法中患者入组、PET技术参数以及PET评效方法的一些疑问,再看看文章最终得出的结论:胰腺癌一线化疗早期评效SUVmax下降20%可以区分患者预后,且优于PERCIST30%的阈值,很有意义的结论,但得到结果的过程是否可靠?可能尚需斟酌。阅读这篇文献或可对关于如何设计一个比较严谨的PET评效研究产生一些启发,一个理想的临床研究的结果首先可以反应在这个研究人群及情形下的真实性,从而再进一步外推到更大的群体,而在其中,严谨的临床设计是决定结果真实准确的关键。
总结与点评:
罗亚平副教授总结了文献内容,指出这篇研究FDGPET/CT在胰腺癌化疗疗效评估的文章,检查技术和研究病种虽平平无奇,但仍能通过科学研究来解答临床问题。近年来核医学领域的新药研究层出不穷,但不意味着不新的技术就做不好科研。找好临床关注的问题是做好科研的第一步。另外这篇文章发表在JNM,但它仍然有不严谨、不科学之处,这提示我们在阅读文献时要保持批判性思维。接下来霍力教授做了总结,感谢主办方给予这次宝贵的交流机会,并对青委组织的文献导读做出的成绩予以肯定和支持。霍力教授同样指出阅读文献时批判性思维的重要性。最后霍力教授对线上提问进行了回答,并宣布本次活动圆满结束,共同期待下一次活动的到来!