央廣網(wǎng)北京11月7日消息(記者 阮修星)11月7日,北京市衛(wèi)生健康委發(fā)布《關(guān)于開展醫(yī)療領(lǐng)域人工智能應(yīng)用評(píng)測工作的通知》,正式向各企業(yè)、研究機(jī)構(gòu)提供評(píng)測服務(wù),這標(biāo)志著北京的國家人工智能應(yīng)用中試基地(醫(yī)療領(lǐng)域)對(duì)外服務(wù)能力正持續(xù)拓展和深化。
隨著近年來人工智能技術(shù)的飛速進(jìn)步,醫(yī)療AI正在加速向輔助醫(yī)生,承擔(dān)部分醫(yī)生技術(shù)勞動(dòng)的方向發(fā)展。如何堅(jiān)持科技為民、科技向善,確保醫(yī)療AI應(yīng)用的規(guī)范安全有效,成為公眾關(guān)注和行業(yè)關(guān)心的問題。北京市衛(wèi)生健康委在國家基地建設(shè)中專門設(shè)立醫(yī)療人工智能應(yīng)用評(píng)測中心(以下簡稱“評(píng)測中心”),旨在建立醫(yī)療AI評(píng)測的制度體系與規(guī)范標(biāo)準(zhǔn),依托首都高水平醫(yī)院和專家隊(duì)伍、高質(zhì)量醫(yī)療數(shù)據(jù),驗(yàn)證醫(yī)療AI的臨床輔助決策能力和效果,筑牢醫(yī)療人工智能應(yīng)用安全底線,同時(shí)助力醫(yī)療人工智能產(chǎn)品迭代優(yōu)化。
由于醫(yī)療行為關(guān)乎公眾生命健康,醫(yī)療AI的評(píng)測必須堅(jiān)持高標(biāo)準(zhǔn)、嚴(yán)要求,至少具有以下三個(gè)方面的要求:
一是評(píng)測內(nèi)容的全面性。醫(yī)療人工智能應(yīng)用不僅要看“準(zhǔn)確率”指標(biāo),從患者角度來說,還需要考慮到倫理和信息安全;從醫(yī)生角度來說,除了準(zhǔn)確的結(jié)果,更關(guān)注推理過程,也就是“為什么得出這個(gè)結(jié)論”。所以醫(yī)療人工智能應(yīng)用要從“安全(合規(guī)倫理)、專業(yè)(醫(yī)學(xué)知識(shí))、實(shí)用(流程適配)”等多個(gè)角度進(jìn)行評(píng)測。
二是評(píng)測數(shù)據(jù)的權(quán)威性。醫(yī)療領(lǐng)域的人工智能應(yīng)用評(píng)測要用“真案例、真標(biāo)準(zhǔn)”,要用臨床上真實(shí)的、有明確診療方案,甚至是一些罕見、疑難案例,還要參考國內(nèi)外最新的診療指南去評(píng)測,才能區(qū)分出人工智能應(yīng)用在嚴(yán)肅醫(yī)療場景下的真實(shí)差異。
三是評(píng)測結(jié)果的科學(xué)性。對(duì)醫(yī)療人工智能應(yīng)用的評(píng)測,不能只看答案,還要對(duì)它的思考和答題過程進(jìn)行評(píng)價(jià),防止“蒙”對(duì)了結(jié)果,邏輯卻錯(cuò)了。
針對(duì)上述這幾個(gè)醫(yī)療領(lǐng)域人工智能應(yīng)用評(píng)測的重點(diǎn)難點(diǎn)問題,北京市衛(wèi)生健康委委托北京市衛(wèi)生健康大數(shù)據(jù)與政策研究中心,配合醫(yī)療領(lǐng)域國家人工智能應(yīng)用中試基地建設(shè),聯(lián)合全國重點(diǎn)醫(yī)院與頂尖專家團(tuán)隊(duì),拿出破題方案,打造北京醫(yī)療人工智能應(yīng)用評(píng)測中心。
在評(píng)測內(nèi)容上,評(píng)測中心專門建立了一套多維度考核標(biāo)準(zhǔn),從百姓和醫(yī)生最關(guān)心的角度出發(fā),形成6個(gè)核心維度(醫(yī)學(xué)合規(guī)倫理、醫(yī)學(xué)循證與知識(shí)、通用輔助能力、?圃\療質(zhì)控管理、診療流程適配性、診療決策準(zhǔn)確性)的評(píng)測指標(biāo)體系,包含70多項(xiàng)具體評(píng)測任務(wù),全面覆蓋看“安全”,查有沒有泄露隱私、有沒有違背醫(yī)學(xué)倫理;看“專業(yè)”,測會(huì)不會(huì)用最新的醫(yī)學(xué)教材、診療指南;看“適用”,查是否符合醫(yī)生的思考邏輯和日常工作流程;看“準(zhǔn)確”,看AI診斷對(duì)不對(duì),給的治療建議合不合理。
在評(píng)測數(shù)據(jù)上,評(píng)測中心聯(lián)合重點(diǎn)醫(yī)院、科研機(jī)構(gòu)及權(quán)威專家團(tuán)隊(duì),用臨床案例、國內(nèi)外權(quán)威醫(yī)學(xué)教材和最新臨床診療指南,共同構(gòu)建高質(zhì)量評(píng)測數(shù)據(jù)集。權(quán)威醫(yī)學(xué)教材確;A(chǔ)知識(shí)扎實(shí),臨床診療指南保證與臨床實(shí)踐同步,典型案例覆蓋常見病、罕見病及疑難病!翱碱}”由國內(nèi)頂級(jí)?聘吣曩Y醫(yī)師全程深度參與編撰與審核而成,確保評(píng)測的科學(xué)性和權(quán)威性。
在評(píng)測方法上,評(píng)測中心嚴(yán)格實(shí)施用戶申請(qǐng)、系統(tǒng)評(píng)測、專家復(fù)核三個(gè)環(huán)節(jié),系統(tǒng)根據(jù)應(yīng)用類型自動(dòng)匹配評(píng)測任務(wù)并生成評(píng)測報(bào)告,由臨床專家進(jìn)行復(fù)核。在計(jì)分方式上,除采用國際通用基礎(chǔ)評(píng)測指標(biāo)外,評(píng)測中心還創(chuàng)新引入基于人工智能的評(píng)分機(jī)制,也就是用一個(gè)“裁判模型”來判卷,綜合“考生”的診療思路、推理邏輯、答題結(jié)果進(jìn)行量化打分,避免只看最終結(jié)果的片面性。比如兩款人工智能應(yīng)用都診斷對(duì)了,評(píng)測系統(tǒng)會(huì)給推理邏輯更嚴(yán)謹(jǐn)、依據(jù)更充分的那款打更高分,確保評(píng)測結(jié)果客觀公正、科學(xué)可信。
《通知》中還提到,本次評(píng)測服務(wù)是醫(yī)療領(lǐng)域國家人工智能應(yīng)用中試基地首次提供對(duì)外評(píng)測服務(wù),主要聚焦胸外科診療領(lǐng)域開展專項(xiàng)評(píng)測。評(píng)測結(jié)果將根據(jù)參評(píng)單位意愿適時(shí)公布,評(píng)測表現(xiàn)優(yōu)秀的應(yīng)用將優(yōu)先納入國家人工智能應(yīng)用中試基地推廣渠道,向各級(jí)醫(yī)療機(jī)構(gòu)重點(diǎn)推薦。后續(xù),評(píng)測中心將陸續(xù)開展更多醫(yī)學(xué)領(lǐng)域的評(píng)測服務(wù),覆蓋內(nèi)科、外科、兒科等專業(yè)領(lǐng)域,助力醫(yī)療人工智能產(chǎn)業(yè)健康發(fā)展,更好地服務(wù)人民群眾健康需求。
長按二維碼關(guān)注精彩內(nèi)容





