《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 设计应用 > 基于多目标优化的医学影像可解释性增强研究
基于多目标优化的医学影像可解释性增强研究
网络安全与数据治理
李海芳1,2,3,唐超3,岳鑫3,张强1,2
1.大连理工大学计算机科学与技术学院; 2.大连理工大学社会计算与认知智能教育部重点实验室; 3.新疆师范大学计算机科学技术学院
摘要: 针对医学影像场景的解释需求,提出一种基于多目标粒子群优化的解释增强方法,通过优化解释生成过程来提升解释质量与临床可读性。该方法在 LIME(局部与模型无关的解释)框架中引入多目标搜索机制,实现了高解释保真性与高区域稀疏性的自适应权衡,并获得了帕累托最优的解释结果。为验证方法有效性,以膝关节X光影像为实验对象,基于公开膝骨关节炎数据集在典型卷积神经网络上进行了实验评估。实验结果显示,保真性最高可提升18%,稀疏性最大可降低22%,展现出更高的聚焦性、稳定性,为基于人工智能的医疗影像可信诊断提供了可行技术路径。
中圖分類號:TP309.7文獻(xiàn)標(biāo)志碼:ADOI:10.19358/j.issn.2097-1788.2026.04.008
中文引用格式:李海芳,唐超,岳鑫,等. 基于多目標(biāo)優(yōu)化的醫(yī)學(xué)影像可解釋性增強(qiáng)研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2026,45(4):59-67.
英文引用格式:Li Haifang,Tang Chao,Yue Xin, et al. Multiobjective optimization for enhanced explainability in medical imaging models
[J].Cyber Security and Data Governance,2026,45(4):59-67.
Multi-objective optimization for enhanced explainability in medical imaging models
Li Haifang1,2,3,Tang Chao3,Yue Xin3,Zhang Qiang1,2
1.School of Computer Science and Technology,Dalian University of Technology; 2. Key Laboratory of Social Computing and Cognitive Intelligence (Dalian University of Technology),Ministry of Education;3. School of Computer Science and Technology,Xinjiang Normal University
Abstract: To address the need for reliable interpretability in medical imaging, this study proposes a multi-objective particle swarm optimization-enhanced explanation framework that improves explanation quality and clinical readability by optimizing the LIME (Local and Model-Agnostic Explanations) process. The proposed method incorporates a multi-objective search strategy into the LIME pipeline, enabling an adaptive tradeoff between explanatory fidelity and regional sparsity, and producing Pareto-optimal explanation outcomes. Experiments conducted on knee X-ray images from a publicly available knee osteoarthritis dataset using representative convolutional neural networks demonstrate that the method increases fidelity by up to 18% and reduces sparsity by up to 22%, resulting in more focused and stable explanations. These results indicate that the proposed framework offers a feasible and effective pathway toward trustworthy AI-driven medical image interpretation.
Key words : knee osteoarthritis; medical image explainability; multiobjective particle swarm optimization; LIME;trustworthy medical artificial intelligence

引言

隨著深度學(xué)習(xí)模型與計(jì)算資源的快速發(fā)展,數(shù)據(jù)驅(qū)動方法已在視覺與醫(yī)學(xué)影像分析中取得顯著進(jìn)展。然而,由于深度神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)與訓(xùn)練過程中的高度復(fù)雜性,其決策機(jī)制往往呈現(xiàn)“黑箱”特征,使得模型預(yù)測結(jié)果難以被人類理解與復(fù)核。在醫(yī)療影像等高風(fēng)險應(yīng)用場景中,這種不可解釋性會直接影響系統(tǒng)的可信性、可審計(jì)性與臨床可用性,并進(jìn)一步牽涉到人機(jī)協(xié)作流程與責(zé)任歸屬等系統(tǒng)性問題[1-2]。相關(guān)研究指出,可信醫(yī)療AI的解釋機(jī)制不應(yīng)僅停留在單一算法層面的可視化呈現(xiàn),而需與臨床工作流、交互方式與問責(zé)框架形成閉環(huán),以支撐真實(shí)場景下的信任建立與可控使用[3]。

在醫(yī)學(xué)影像領(lǐng)域,膝骨關(guān)節(jié)炎(Knee Osteoarthritis, KOA)是較為常見的退行性關(guān)節(jié)疾病,其 X 光影像中的關(guān)節(jié)間隙變窄、軟骨下骨硬化及骨贅形成等特征是臨床分級和診斷的關(guān)鍵依據(jù)。近年來,KOA 的自動診斷與分級任務(wù)的處理廣泛應(yīng)用卷積神經(jīng)網(wǎng)絡(luò),并在多個公開數(shù)據(jù)集上獲得了較高的識別精度[4]。但多數(shù)方法仍以“預(yù)測輸出”為主,缺乏對模型預(yù)測依據(jù)的清晰解釋,臨床醫(yī)生難以評估模型是否關(guān)注了合理的病灶結(jié)構(gòu),進(jìn)而限制了其在輔助診斷場景中的應(yīng)用效果。

圍繞可解釋人工智能(Explainable Artificial Intelligence, XAI),現(xiàn)有研究主要可以分為事后解釋與事前可解釋建模兩大類。其中,事后解釋方法通過可視化或歸因分析對黑盒模型的局部決策進(jìn)行近似刻畫,代表性方法包括基于梯度的 GradCAM 與GradCAM++[5-6]、模型無關(guān)的 LIME [7]與SHAP [8],以及積分梯度方法[9]。因無需修改原有模型結(jié)構(gòu),此類方法在醫(yī)學(xué)影像中應(yīng)用較為廣泛。然而,多項(xiàng)研究表明,顯著圖與歸因結(jié)果對模型參數(shù)、輸入擾動與解釋超參數(shù)等高度敏感,可能產(chǎn)生不穩(wěn)定甚至錯誤的解釋;僅憑“看起來合理”的可視化難以保證解釋的可信性[10-11],因此需要綜合系統(tǒng)化的量化評估與魯棒性檢驗(yàn)加以規(guī)范[12-13]。

在 KOA X 光影像場景中,上述挑戰(zhàn)更為突出。一方面,關(guān)鍵特征通常呈現(xiàn)局部化、細(xì)粒度分布,傳統(tǒng) LIME 的超像素?cái)_動與默認(rèn)參數(shù)配置往往難以與醫(yī)學(xué)結(jié)構(gòu)精確對齊,容易導(dǎo)致解釋區(qū)域過散、過大或覆蓋無關(guān)特征;另一方面,LIME 以單一局部擬合優(yōu)度作為優(yōu)化目標(biāo)時,可能出現(xiàn)解釋區(qū)域“膨脹”,即通過激活大量非關(guān)鍵區(qū)域來提升擬合度,進(jìn)而削弱解釋的稀疏性與定位能力。這類不穩(wěn)定現(xiàn)象已在多項(xiàng)醫(yī)學(xué)影像解釋可信性評估研究中被觀測到[11]。

從方法論角度看,可信醫(yī)學(xué)影像解釋通常需同時滿足兩個核心屬性:一是高保真性,即解釋結(jié)果應(yīng)忠實(shí)反映模型的局部決策行為;二是高稀疏性,即解釋區(qū)域應(yīng)聚焦于有限且具有臨床意義的關(guān)鍵區(qū)域,以提升可讀性與診斷效率[12-14]。二者之間存在內(nèi)在張力:單純追求擬合精度往往引入冗余高亮,而過度稀疏則可能損失關(guān)鍵區(qū)域信息。為此,本文引入多目標(biāo)優(yōu)化視角,將解釋生成過程從“單點(diǎn)參數(shù)設(shè)定”調(diào)整為“可控權(quán)衡的參數(shù)搜索”。群智能優(yōu)化方法因參數(shù)量少、全局搜索能力強(qiáng),且對復(fù)雜目標(biāo)具有良好適應(yīng)性,已成為處理多目標(biāo)權(quán)衡問題的經(jīng)典方法[15]。

基于以上背景,本文以 KOA X 光影像解釋為研究對象,提出一種基于多目標(biāo)粒子群優(yōu)化的事后可解釋性增強(qiáng)方法(MOPSOLIME)。該方法在不改變原有診斷模型結(jié)構(gòu)的前提下,將解釋過程形式化為“保真性-稀疏性”的雙目標(biāo)優(yōu)化問題,通過自動搜索 LIME 參數(shù)空間,在兩類目標(biāo)之間實(shí)現(xiàn)可控平衡,進(jìn)而獲得更穩(wěn)定、聚焦且具備臨床可讀性的解釋結(jié)果。本文的主要貢獻(xiàn)包括:

(1)提出一種面向 KOA 醫(yī)學(xué)影像的多目標(biāo)解釋優(yōu)化框架,在固定診斷模型條件下對 LIME 解釋參數(shù)進(jìn)行整體優(yōu)化;

(2)構(gòu)建以局部擬合優(yōu)度與解釋區(qū)域稀疏性為核心的可量化評價指標(biāo),為解釋質(zhì)量評估與優(yōu)化提供統(tǒng)一標(biāo)準(zhǔn);

(3)在公開 KOA 數(shù)據(jù)集及多種主流網(wǎng)絡(luò)結(jié)構(gòu)上驗(yàn)證方法有效性,實(shí)驗(yàn)結(jié)果表明該方法在不降低診斷性能的前提下提升了解釋穩(wěn)定性與臨床可讀性。


本文詳細(xì)內(nèi)容請下載:

http://m.ihrv.cn/resource/share/2000007060


作者信息:

李海芳1,2,3,唐超3,岳鑫3,張強(qiáng)1,2

(1.大連理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,遼寧大連116024;

2.大連理工大學(xué)社會計(jì)算與認(rèn)知智能教育部重點(diǎn)實(shí)驗(yàn)室,遼寧大連116024;

3.新疆師范大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,新疆烏魯木齊830054)

2.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。