消息稱ChatGPT-4在兒科病例診斷中表現(xiàn)欠佳

消息稱ChatGPT-4在兒科病例診斷中表現(xiàn)欠佳

近日,一項(xiàng)發(fā)表在《JAMA Pediatrics》的研究引起了人們的關(guān)注。在這項(xiàng)由紐約科恩兒童醫(yī)學(xué)中心的研究人員完成的研究中,大型語言模型ChatGPT的最新版本ChatGPT-4在診斷兒科病例時(shí)的表現(xiàn)被認(rèn)為令人失望。

研究小組讓ChatGPT-4嘗試診斷100個(gè)來自兩大醫(yī)學(xué)雜志的已發(fā)表兒科病例。這些病例都需要臨床醫(yī)生根據(jù)癥狀和表現(xiàn)進(jìn)行診斷。然而,ChatGPT-4的表現(xiàn)卻不盡如人意。它只能正確診斷17%的病例,在72%的病例中給出了錯(cuò)誤的診斷,還有11%的病例中給出的診斷過于寬泛,沒有完全捕捉到正確的病癥。

研究人員分析發(fā)現(xiàn),ChatGPT-4在建立某些疾病之間的聯(lián)系上比較薄弱。例如,它沒有將兒童自閉癥與可能的維生素缺乏癥聯(lián)系起來。此外,它也時(shí)常忽略常見病癥而提出一些罕見的診斷。

這項(xiàng)研究強(qiáng)調(diào)了臨床醫(yī)生豐富經(jīng)驗(yàn)在復(fù)雜診斷中的重要性。雖然AI系統(tǒng)具有潛力,但目前看來尚未準(zhǔn)備好取代人類醫(yī)生,尤其是在較為棘手的兒科病例上。研究人員認(rèn)為,可以通過使用準(zhǔn)確可信的醫(yī)學(xué)文獻(xiàn)來專門訓(xùn)練ChatGPT,并允許其實(shí)時(shí)獲取病例數(shù)據(jù)進(jìn)行“調(diào)諧”,來提高其診斷的準(zhǔn)確性。

盡管該研究有其局限性,但它確實(shí)突出了當(dāng)前AI系統(tǒng)在臨床應(yīng)用上面臨的一些困難。兒科病例尤其復(fù)雜多變,對(duì)機(jī)器提出了巨大挑戰(zhàn)。但研究人員還是對(duì)AI機(jī)器人在未來輔助醫(yī)療決策中發(fā)揮重要作用持樂觀態(tài)度。

這項(xiàng)研究的結(jié)果提醒我們,盡管人工智能在許多領(lǐng)域取得了令人矚目的成就,但在醫(yī)療領(lǐng)域的應(yīng)用仍需謹(jǐn)慎。人工智能的診斷能力還有很大的提升空間,特別是在處理復(fù)雜的兒科病例時(shí)。因此,在將人工智能完全引入臨床診斷之前,需要進(jìn)行更深入的研究和改進(jìn)。

總的來說,這項(xiàng)研究為我們提供了一個(gè)寶貴的提醒:人工智能并非萬能,特別是在涉及人類健康和生命的醫(yī)療領(lǐng)域。雖然人工智能有著巨大的潛力,但目前看來,它還無法完全取代人類醫(yī)生的專業(yè)知識(shí)和經(jīng)驗(yàn)。在未來,人工智能或許可以作為醫(yī)生的得力助手,幫助醫(yī)生更快速、更準(zhǔn)確地做出診斷。但在此之前,我們?nèi)孕鑼?duì)人工智能在醫(yī)療領(lǐng)域的應(yīng)用保持審慎和理性的態(tài)度。

原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請(qǐng)注明出處:http://leeannwhittemore.com/article/615359.html

若安丶的頭像若安丶管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論