既有幫助，也有干擾，AI能否讓醫(yī)生表現(xiàn)更好？

2024-03-29 17:43:22 來源: 科技日?qǐng)?bào) 點(diǎn)擊數(shù)：

科技日?qǐng)?bào)記者?張夢(mèng)然

醫(yī)療人工智能（AI）最受“吹捧”的承諾之一，就是它們能夠幫助人類臨床醫(yī)生更精確地解讀X光和CT掃描等圖像，從而作出更準(zhǔn)確的診斷報(bào)告，增強(qiáng)影像科醫(yī)生的表現(xiàn)。

肺部腫塊的胸部X光檢查。這種圖像被用來訓(xùn)練AI模型檢測(cè)和診斷疾病。
圖片來源：美國國立衛(wèi)生研究院臨床中心

但實(shí)際情況確實(shí)如此嗎？

美國哈佛大學(xué)醫(yī)學(xué)院、麻省理工學(xué)院和斯坦福大學(xué)的合作研究表明，使用AI工具進(jìn)行圖像解讀的效果，似乎因臨床醫(yī)生而異。

換句話說，有益還是無用，現(xiàn)階段還是人類說了算。因?yàn)檠芯拷Y(jié)果表明，個(gè)體臨床醫(yī)生的差異，會(huì)以AI專家們尚未完全理解的關(guān)鍵方式影響著人與機(jī)器之間的互動(dòng)。該分析近日發(fā)表在《自然·醫(yī)學(xué)》雜志上。

考慮醫(yī)生個(gè)人因素

研究表明，在某些情況下，AI的使用可能會(huì)干擾放射科醫(yī)生的表現(xiàn)，并影響他們解釋的準(zhǔn)確性。

圖片來源：美國國家醫(yī)學(xué)院官網(wǎng)

雖然之前的研究表明，AI助手確實(shí)可以提高醫(yī)生的診斷表現(xiàn)，但這些研究將醫(yī)生視為一個(gè)整體，而沒有考慮不同醫(yī)生之間的差異。在臨床上，每一位醫(yī)生的判斷，對(duì)患者來說都是100%的。

相比之下，這項(xiàng)新研究著眼于臨床醫(yī)生的個(gè)人因素——專業(yè)領(lǐng)域、實(shí)踐年限、之前使用AI工具的經(jīng)驗(yàn)，并分析這些因素如何在人機(jī)協(xié)作中發(fā)揮作用。

研究人員分析了AI如何影響140名放射科醫(yī)生在15項(xiàng)X射線診斷任務(wù)中的表現(xiàn)，即醫(yī)生需要可靠地發(fā)現(xiàn)圖像上的明顯特征并作出準(zhǔn)確診斷。該分析涉及324名罹患15種病癥的患者病例。

為了確定AI如何影響醫(yī)生發(fā)現(xiàn)和正確識(shí)別問題的能力，研究人員使用先進(jìn)的計(jì)算方法來獲取使用AI和不使用AI時(shí)的表現(xiàn)變化。

結(jié)果顯示，AI輔助的效果在放射科醫(yī)生之間不一致且各不相同，一些放射科醫(yī)生的表現(xiàn)因AI而提高，而另一些醫(yī)生的表現(xiàn)則“惡化”。

英國皇家醫(yī)學(xué)院布拉瓦尼克研究所生物醫(yī)學(xué)信息學(xué)助理教授帕蘭納?！だ湛茽柎_認(rèn)了研究團(tuán)隊(duì)這一發(fā)現(xiàn)，并表示“我們不應(yīng)該將醫(yī)生視為一個(gè)統(tǒng)一的群體，只考慮AI對(duì)其表現(xiàn)的‘平均’影響”。

不過，這一發(fā)現(xiàn)并不意味著應(yīng)該阻止醫(yī)生和診所采用AI。相反，結(jié)果表明需要更好地了解人類和AI如何互動(dòng)，并設(shè)計(jì)精心校準(zhǔn)的方法來提高而不是損害人類的表現(xiàn)。

AI“助手”尚難預(yù)測(cè)

鑒于影像科被認(rèn)為是能得到AI最大助力的臨床醫(yī)學(xué)領(lǐng)域，本次研究結(jié)果頗具代表意義。

此次發(fā)現(xiàn)中值得注意的是，在放射科，AI以令人驚訝的方式產(chǎn)生著影響人類醫(yī)生的表現(xiàn)。

例如，與研究人員預(yù)期相反，放射科醫(yī)生有多少年的經(jīng)驗(yàn)、他們是否專門從事胸部放射科，以及他們之前是否使用過AI設(shè)備等因素，并不能可靠地預(yù)測(cè)AI工具對(duì)他們工作表現(xiàn)的影響。

另一項(xiàng)挑戰(zhàn)普遍觀點(diǎn)的發(fā)現(xiàn)是：基線表現(xiàn)不佳的臨床醫(yī)生，并不能持續(xù)穩(wěn)定地從AI中得到幫助?？傮w而言，無論有或沒有AI，基線表現(xiàn)較低的放射科醫(yī)生的表現(xiàn)還是較低。對(duì)于基線表現(xiàn)較好的放射科醫(yī)生來說也是如此——無論有沒有AI，他們的總體表現(xiàn)始終良好。

但可以肯定的是，更準(zhǔn)確的AI提高了放射科醫(yī)生的表現(xiàn)，而水平一般的AI則會(huì)降低人類臨床醫(yī)生的診斷準(zhǔn)確性。

這一發(fā)現(xiàn)的重要意義也在于：在臨床部署之前，必須測(cè)試和驗(yàn)證AI工具的性能，以確保劣質(zhì)AI不會(huì)干擾人類臨床醫(yī)生的判斷，從而延誤患者病情。

影響臨床醫(yī)學(xué)未來

臨床醫(yī)生擁有不同水平的專業(yè)知識(shí)、經(jīng)驗(yàn)和決策風(fēng)格，因此確保AI能反映這種多樣性，對(duì)于有針對(duì)性地實(shí)施治療至關(guān)重要。個(gè)體因素及變化，應(yīng)成為確保AI進(jìn)步的關(guān)鍵，而不是干擾并最終影響診斷的因素。

有意思的是，這一發(fā)現(xiàn)并沒有解釋AI為何會(huì)對(duì)人類臨床醫(yī)生的表現(xiàn)產(chǎn)生不同的影響，但隨著AI對(duì)臨床醫(yī)學(xué)的影響越來越深遠(yuǎn)，理解其中原因就顯得至關(guān)重要。關(guān)于這一點(diǎn)，AI專家依然在努力。

研究團(tuán)隊(duì)補(bǔ)充說，下一步，放射科醫(yī)生與AI的交互，應(yīng)該在模擬現(xiàn)實(shí)場(chǎng)景的實(shí)驗(yàn)環(huán)境中展開測(cè)試，測(cè)試結(jié)果需要反映實(shí)際患者群體的情況。而除了提高AI工具的準(zhǔn)確性之外，培訓(xùn)放射科醫(yī)生去及時(shí)檢測(cè)不準(zhǔn)確的AI、審查并質(zhì)疑AI工具的診斷，也很重要。

換言之，在AI幫你之前，你需要先提高自身。

責(zé)任編輯：常麗君

既有幫助，也有干擾，AI能否讓醫(yī)生表現(xiàn)更好？

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會(huì)影響您正常瀏覽本網(wǎng)頁

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點(diǎn)擊下面圖標(biāo)升級(jí)或更換您的瀏覽器

3.暫不升級(jí)，繼續(xù)瀏覽

既有幫助，也有干擾，AI能否讓醫(yī)生表現(xiàn)更好？

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會(huì)影響您正常瀏覽本網(wǎng)頁

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點(diǎn)擊下面圖標(biāo)升級(jí)或更換您的瀏覽器

3.暫不升級(jí)，繼續(xù)瀏覽

既有幫助，也有干擾，AI能否讓醫(yī)生表現(xiàn)更好？

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會(huì)影響您正常瀏覽本網(wǎng)頁

3.暫不升級(jí)，繼續(xù)瀏覽