
一创新研究基于组织芯片系统评估免疫组化染色、人工智能图像标准化及HER2分型标准对判读一致性的影响配资炒股网站选择配资,为提升HER2检测准确性提供量化依据。
表皮生长因子受体2(HER2)是乳腺癌分子分型及靶向治疗中的关键生物标志物,在临床决策中具有重要意义。近年来,随着HER2低及超低表达人群在治疗实践中的关注度提升,传统二元HER2分型体系的局限逐渐显现,对检测精度与判读一致性的要求不断提高。2023年美国临床学会/美国病理学家协会(ASCO/CAP)更新的HER2检测指南,强调了准确区分免疫组化(IHC)评分0与1+的重要性及其潜在的临床意义[1]。然而,在实际检测过程中,受组织处理、检测平台、肿瘤异质性及病理医师经验等因素影响,HER2评分仍存在显著观察者间差异,尤其在HER2低表达病例中更为突出,成为当前精准诊疗的重要限制。
随着数字病理和人工智能(AI)技术的迅速发展,AI在提高判读效率与准确性方面展现出潜力,但在临床诊断应用中仍面临多项挑战,包括扫描质量、图像分辨率及病理医师适应性等问题。其中,全切片成像(WSI)的图像标准化对诊断一致性和可靠性至关重要,却常被忽视。基于此,一研究系统分析了不同免疫组化染色方案、基于AI的图像标准化方法以及多种HER2分类标准对判读一致性的影响,以期为HER2检测的标准化与临床应用提供数据支持[2]。本文特此整理研究重点内容,以飨读者。
研究方法
本研究纳入1063例中山大学肿瘤防治中心浸润性乳腺癌样本,采用Ventana PATHWAY anti-HER2/neu(4B5)抗体,按三种自动化免疫组化染色方案(Nordi QC、方案1、方案2)进行HER2检测。所有切片经40×扫描生成全切片图像(WSI),由8位病理医师独立判读,并依据ASCO/CAP 2023指南评分为0-null,0-UL,1+,2+,和3+。
为减少不同染色条件造成的差异,研究构建了基于人工智能的图像标准化方法,采用改进的基于对比学习的非配对图像转换技术(CUT),以Nordi QC方案的全切片图像为目标域,对方案1和方案2的图像进行标准化处理。标准化后的图像由同一批病理医师重新评分,以评估AI模型对判读一致性的影响。HER2状态同时依据四种体系进行评估:传统IHC分级、ASCO/CAP 2018、ASCO/CAP 2023及研究中探索的新型NULP(null、ultra-low/low、positive)分类标准。通过Fleiss Kappa系数和总体一致率(ORA)评估判读一致性,并采用多因素Logistic回归分析染色方案、AI标准化及分类体系对诊断准确性的独立影响。

图1 改进的对比式非配对图像转换(CUT)方法示意图

图2 不同染色方案及AI标准化后HER2染色结果代表性图像
研究结果
不同染色方案对HER2判读一致性的影响
在三种自动化染色方案中,Nordi QC方案显示出最高的病理判读一致性(Fleiss Kappa = 0.754),方案1与方案2的Fleiss Kappa值分别为0.728和0.734。不同HER2表达水平间一致性差异显著,HER2 0及3+组的评分一致性较高,而1+与2+组明显较低。进一步分层显示,将HER2 0进一步细分为0-null与0-ultra-low时,前者保持较高一致性,而0-ultra-low组一致性极低(Kappa 0.087-0.186),提示极弱膜染色的判读难度较大。多因素Logistic回归分析显示,染色方案是影响判读准确性的显著因素(P < 0.001),与Nordi QC相比,方案1和2均显示出诊断准确性降低,其比值比(OR)分别为0.318(P < 0.001)和0.373(P < 0.001)。
基于AI的图像标准化提高判读一致性
研究进一步评估了AI图像标准化对HER2判读一致性的影响。结果显示,经过AI处理后,方案1和方案2的HER2定量评分(H-score)与Nordi QC参考方案更加接近,整体一致性均有所提升。其中,方案2-AI的总体Fleiss Kappa值由0.734提高至0.758。分层分析显示,AI标准化主要改善了方案2在HER2 0(包括null与ultra-low)病例中的一致性,而其余类别变化不明显;方案1-AI在各HER2评分类别中的完全一致率与原始方案相当。Logistic回归显示,AI标准化对判读准确性具有显著正向影响(P < 0.001),与原始方案相比,AI标准化后的方案1与方案2的诊断准确性分别提高约2.2倍和2.6倍。
不同HER2分类标准的比较
结果显示,不同HER2分类体系下病理医师间一致性存在差异,ASCO/CAP 2018二分类标准一致性最高(Kappa > 0.95),优于ASCO/CAP 2023三分类标准(0.798-0.856)和潜在的NULP标准(0.790-0.956)。无论采用ASCO/CAP 2023或NULP标准,AI图像标准化均能提升方案1与方案2的一致性,尤其在HER2 low及HER2 low/ultra-low亚组中:方案1-AI的Kappa由0.624升至0.670、0.653升至0.732;方案2-AI由0.626升至0.681、0.636升至0.686。进一步分析显示,AI标准化还能提高病理医师间的总体一致率(ORA),在HER2 low及ultra-low病例中效果最明显。多因素分析显示,ASCO/CAP 2018二分类标准诊断准确性最高(OR=20.615),NULP标准优于ASCO/CAP 2023(OR分别为1.472和1.338)。
表1 基于不同的HER2分类标准,不同染色方案的病理学家之间HER2状态的观察者间一致性(Fleiss Kappa值)

总结与展望
本研究通过系统比较三种自动化免疫组化染色方案、不同HER2分类标准及AI图像标准化方法,揭示了技术和判读体系差异对HER2评估一致性的显著影响。AI模型能够在不同染色条件下实现图像特征标准化,从而提高HER2低表达及ultra-low病例的诊断一致性,为HER2检测结果的可重复性提供新思路。
然而,本研究仍存在若干局限。尽管样本量较大,但组织芯片的使用可能与临床常规诊断存在差异,未来研究将纳入活检及切除标本以验证结果的适用性。此外,本研究未对单个染色参数变化对诊断结果的具体影响进行细化分析,AI模型的稳健性亦需在外部、多实验室及多中心队列中进一步验证,以确保其泛化能力与可靠性。未来,随着AI算法与病理质控体系的不断完善,结合统一的染色流程及优化的NULP分类标准,有望进一步提升HER2检测的准确性和临床决策价值。
参考文献:
[1]Wolff AC, et al. Human Epidermal Growth Factor Receptor 2 Testing in Breast Cancer: ASCO-College of American Pathologists Guideline Update. J Clin Oncol. 2023 Aug 1;41(22):3867-3872.
[2]Jiang C, et al. Systematic Analysis of Factors Affecting Human Epidermal Growth Factor Receptor 2 Interpretation Consistency: Staining Protocols, Artificial Intelligence-Based Image Standardization, and Classification Criteria. Lab Invest. 2025 Jun;105(6):104134.
审批编号:2026-11-13 有效期至:2026-11-13本材料由阿斯利康提供,仅供医疗卫生专业人士参考
*“医学界”力求所发表内容专业、可靠,但不对内容的准确性做出承诺;请相关各方在采用或以此作为决策依据时另行核查。
宝盈优配提示:文章来自网络,不代表本站观点。