本指導(dǎo)原則旨在指導(dǎo)注冊(cè)申請(qǐng)人建立人工智能醫(yī)療器械生存周期過(guò)程和準(zhǔn)備人工智能醫(yī)療器械注冊(cè)申報(bào)資料,同時(shí)規(guī)范人工智能醫(yī)療器械的技術(shù)審評(píng)要求,為人工智能醫(yī)療器械、質(zhì)量管理軟件的體系核查提供參考。
本指導(dǎo)原則是對(duì)人工智能醫(yī)療器械的一般要求。注冊(cè)申請(qǐng)人需根據(jù)產(chǎn)品特性和風(fēng)險(xiǎn)程度確定本指導(dǎo)原則具體內(nèi)容的適用性,若不適用詳述理由。注冊(cè)申請(qǐng)人也可采用其他滿(mǎn)足法規(guī)要求的替代方法,但需提供詳盡的支持資料。
本指導(dǎo)原則是在現(xiàn)行法規(guī)、強(qiáng)制性標(biāo)準(zhǔn)體系以及當(dāng)前科技能力、認(rèn)知水平下制定的,隨著法規(guī)、強(qiáng)制性標(biāo)準(zhǔn)體系的不斷完善以及科技能力、認(rèn)知水平的不斷發(fā)展,本指導(dǎo)原則相關(guān)內(nèi)容也將適時(shí)調(diào)整。
本指導(dǎo)原則是供注冊(cè)申請(qǐng)人、審評(píng)人員和檢查人員使用的指導(dǎo)文件,不涉及行政審批事項(xiàng),亦不作為法規(guī)強(qiáng)制執(zhí)行,應(yīng)在遵循相關(guān)法規(guī)的前提下使用本指導(dǎo)原則。
本指導(dǎo)原則作為數(shù)字醫(yī)療(Digital Health)指導(dǎo)原則體系的重要組成部分,采用和遵循醫(yī)療器械軟件、醫(yī)療器械網(wǎng)絡(luò)安全、移動(dòng)醫(yī)療器械、醫(yī)療器械人因設(shè)計(jì)、醫(yī)療器械獨(dú)立軟件生產(chǎn)質(zhì)量現(xiàn)場(chǎng)檢查等相關(guān)指導(dǎo)原則的概念和要求。
本指導(dǎo)原則是人工智能醫(yī)療器械的通用指導(dǎo)原則[取代《深度學(xué)習(xí)輔助決策醫(yī)療器械軟件審評(píng)要點(diǎn)》非臨床部分的要求。],其他含有或涉及人工智能技術(shù)的醫(yī)療器械指導(dǎo)原則可在本指導(dǎo)原則基礎(chǔ)上結(jié)合具體情況進(jìn)行有針對(duì)性的調(diào)整、修改和完善。
本指導(dǎo)原則適用于人工智能醫(yī)療器械的注冊(cè)申報(bào),包括第二類(lèi)、第三類(lèi)人工智能獨(dú)立軟件和含有人工智能軟件組件的醫(yī)療器械(包括體外診斷醫(yī)療器械);適用于自研軟件的注冊(cè)申報(bào),現(xiàn)成軟件組件參照?qǐng)?zhí)行,不適用于外部軟件環(huán)境。
本指導(dǎo)原則也可用作人工智能醫(yī)療器械的體系核查參考。質(zhì)量管理軟件若采用人工智能技術(shù)實(shí)現(xiàn)其功能或用途,亦可參考本指導(dǎo)原則的適用要求。
(一)人工智能醫(yī)療器械
本指導(dǎo)原則所述人工智能醫(yī)療器械是指基于“醫(yī)療器械數(shù)據(jù)”,采用人工智能技術(shù)實(shí)現(xiàn)其預(yù)期用途(即醫(yī)療用途)的醫(yī)療器械。
醫(yī)療器械數(shù)據(jù)是指醫(yī)療器械產(chǎn)生的用于醫(yī)療用途的客觀數(shù)據(jù),如醫(yī)學(xué)影像設(shè)備產(chǎn)生的醫(yī)學(xué)圖像數(shù)據(jù)(如X射線(xiàn)、CT、MRI、超聲、內(nèi)窺鏡、光學(xué)等圖像)、醫(yī)用電子設(shè)備產(chǎn)生的生理參數(shù)數(shù)據(jù)(如心電、腦電、血壓、無(wú)創(chuàng)血糖、心音等波形數(shù)據(jù))、體外診斷設(shè)備產(chǎn)生的體外診斷數(shù)據(jù)(如病理圖像、顯微圖像、有創(chuàng)血糖波形數(shù)據(jù)等);在特殊情形下,通用設(shè)備(非監(jiān)管對(duì)象)產(chǎn)生的用于醫(yī)療用途的客觀數(shù)據(jù)亦屬于醫(yī)療器械數(shù)據(jù),如數(shù)碼相機(jī)拍攝的用于皮膚疾病診斷的皮膚照片、健康電子產(chǎn)品采集的用于心臟疾病預(yù)警的心電數(shù)據(jù)等?;卺t(yī)療器械數(shù)據(jù)包括醫(yī)療器械數(shù)據(jù)的生成、使用等情況,其中使用情況含單獨(dú)使用醫(yī)療器械數(shù)據(jù),或者以醫(yī)療器械數(shù)據(jù)為主聯(lián)合使用非醫(yī)療器械數(shù)據(jù)(如患者主訴信息、檢驗(yàn)檢查報(bào)告結(jié)論、電子病歷、醫(yī)學(xué)文獻(xiàn)等)。
人工智能是指機(jī)器表現(xiàn)出與人類(lèi)智能相關(guān)行為的能力,通常是指通過(guò)感知周?chē)h(huán)境做出合理行動(dòng)以達(dá)到預(yù)期目標(biāo)的計(jì)算機(jī)軟件或系統(tǒng)。機(jī)器學(xué)習(xí)是指與人類(lèi)學(xué)習(xí)行為相關(guān)的人工智能,通常是指通過(guò)整理現(xiàn)有數(shù)據(jù)和/或獲取新數(shù)據(jù)以提升性能的計(jì)算機(jī)軟件或系統(tǒng)。機(jī)器學(xué)習(xí)雖是人工智能的子集,但卻為人工智能的核心領(lǐng)域,當(dāng)前二者對(duì)于醫(yī)療器械而言含義基本相同,故本指導(dǎo)原則從醫(yī)療器械安全有效性評(píng)價(jià)角度出發(fā)對(duì)二者不做嚴(yán)格區(qū)分,統(tǒng)一采用人工智能進(jìn)行表述。
基于非醫(yī)療器械數(shù)據(jù)的醫(yī)學(xué)人工智能產(chǎn)品,或者采用人工智能技術(shù)實(shí)現(xiàn)非醫(yī)療用途和非醫(yī)療器械功能(詳見(jiàn)醫(yī)療器械軟件指導(dǎo)原則)的醫(yī)療器械均非人工智能醫(yī)療器械。醫(yī)學(xué)人工智能產(chǎn)品是否按醫(yī)療器械管理,根據(jù)相應(yīng)分類(lèi)界定指導(dǎo)原則進(jìn)行判定,必要時(shí)申請(qǐng)醫(yī)療器械分類(lèi)界定。
(二)人工智能醫(yī)療器械類(lèi)型
從醫(yī)療器械軟件角度,人工智能醫(yī)療器械可分為人工智能獨(dú)立軟件和人工智能軟件組件,故其類(lèi)型劃分可參考醫(yī)療器械軟件指導(dǎo)原則相關(guān)維度。
人工智能醫(yī)療器械從用途角度可分為輔助決策類(lèi)和非輔助決策類(lèi)。其中,輔助決策是指通過(guò)提供診療活動(dòng)建議輔助用戶(hù)(如醫(yī)務(wù)人員、患者)進(jìn)行醫(yī)療決策,如通過(guò)病灶特征識(shí)別、病灶性質(zhì)判定、用藥指導(dǎo)、治療計(jì)劃制定進(jìn)行輔助分診、輔助檢測(cè)、輔助診斷、輔助治療等,相當(dāng)于用戶(hù)的“助手”。反之,僅提供醫(yī)療參考信息而不進(jìn)行醫(yī)療決策即為非輔助決策,包括流程優(yōu)化、診療驅(qū)動(dòng),前者如成像流程簡(jiǎn)化、診療流程簡(jiǎn)化等,后者如成像質(zhì)量改善、成像速度提高、自動(dòng)測(cè)量、自動(dòng)分割、三維重建等,相當(dāng)于用戶(hù)的“工具”。此外,輔助決策和非輔助決策從實(shí)時(shí)性角度均可細(xì)分為實(shí)時(shí)和非實(shí)時(shí),前者風(fēng)險(xiǎn)通常高于后者。
人工智能醫(yī)療器械從功能角度大體上可分為處理功能、控制功能、安全功能。其中,處理功能又可分為前處理功能和后處理功能,前處理功能是指采集人體解剖、生理信息生成醫(yī)療器械數(shù)據(jù)過(guò)程的處理功能,如成像流程簡(jiǎn)化、成像質(zhì)量改善、成像速度提高等;后處理功能是指利用醫(yī)療器械數(shù)據(jù)生成診療信息或進(jìn)行醫(yī)療干預(yù)過(guò)程的處理功能,如診療流程簡(jiǎn)化、自動(dòng)測(cè)量、自動(dòng)分割、三維重建、病灶特征識(shí)別、病灶性質(zhì)判定、用藥指導(dǎo)、治療計(jì)劃制定等??刂乒δ苁侵缚刂?驅(qū)動(dòng)醫(yī)療器械硬件運(yùn)行的功能,如閉環(huán)控制、機(jī)械臂運(yùn)動(dòng)控制等。安全功能是指保證醫(yī)療器械安全性的功能,如風(fēng)險(xiǎn)預(yù)警、急??刂频取?/p>
人工智能醫(yī)療器械從算法角度具有多種類(lèi)型劃分維度。從學(xué)習(xí)策略角度可分為有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí),前者需要對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)注,如線(xiàn)性回歸、邏輯回歸、決策樹(shù)、樸素貝葉斯、K近鄰、支持向量機(jī)等經(jīng)典回歸、分類(lèi)算法,后者無(wú)需對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)注,如K均值、主成分分析等經(jīng)典聚類(lèi)、降維算法,前者對(duì)于數(shù)據(jù)標(biāo)注的要求高于后者。從學(xué)習(xí)方法角度可分為基于模型的算法和基于數(shù)據(jù)的算法,前者采用統(tǒng)計(jì)模型、規(guī)則推理等方法,后者主要采用大數(shù)據(jù)方法,前者對(duì)于訓(xùn)練數(shù)據(jù)量的要求低于后者。從可解釋性角度可分為白盒算法和黑盒算法,前者特征提取需要人為干預(yù),可與現(xiàn)有醫(yī)學(xué)知識(shí)建立關(guān)聯(lián),后者自動(dòng)完成特征提取,難與現(xiàn)有醫(yī)學(xué)知識(shí)建立關(guān)聯(lián),前者可解釋性?xún)?yōu)于后者。
上述類(lèi)型劃分維度相互交叉,例如:前處理和后處理均可采用不同類(lèi)型的人工智能算法實(shí)現(xiàn)輔助決策、非輔助決策用途,有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)既可采用基于模型的算法、基于數(shù)據(jù)的算法,又可采用黑盒算法、白盒算法。同時(shí),同一維度亦不存在嚴(yán)格的劃分界線(xiàn),例如:在用途方面,通過(guò)圖像識(shí)別技術(shù)進(jìn)行流程優(yōu)化則需考慮診療驅(qū)動(dòng)相關(guān)要求,自動(dòng)測(cè)量結(jié)果若為醫(yī)療決策重要指標(biāo)(如血流儲(chǔ)備分?jǐn)?shù)FFR)則屬于輔助決策范疇;在功能方面,控制功能、安全功能可與處理功能相結(jié)合,前處理過(guò)程可包含后處理功能;在算法方面,某些算法既可用于有監(jiān)督學(xué)習(xí)又可用于無(wú)監(jiān)督學(xué)習(xí),有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)可結(jié)合為半監(jiān)督學(xué)習(xí);基于模型的算法亦需數(shù)據(jù)的支持,基于數(shù)據(jù)的算法亦可生成模型;白盒算法和黑盒算法可組合使用成為灰盒算法。
同樣,人工智能醫(yī)療器械從成熟度角度可分為成熟和全新兩種類(lèi)型,其中成熟是指安全有效性已在醫(yī)療實(shí)踐中得到充分證實(shí)的情形,全新是指未上市或安全有效性尚未在醫(yī)療實(shí)踐中得到充分證實(shí)的情形。人工智能醫(yī)療器械的算法、功能、用途若有一項(xiàng)為全新則屬于全新類(lèi)型,反之屬于成熟類(lèi)型。
人工智能醫(yī)療器械可同時(shí)采用多種、多個(gè)人工智能算法,在前處理、后處理過(guò)程中實(shí)現(xiàn)輔助決策、非輔助決策用途。因此,注冊(cè)申請(qǐng)人需結(jié)合人工智能醫(yī)療器械的預(yù)期用途、使用場(chǎng)景、核心功能以及所用算法的類(lèi)型特點(diǎn)、技術(shù)特征、組合形式開(kāi)展相應(yīng)產(chǎn)品質(zhì)控工作,以保證產(chǎn)品的安全有效性。
(三)人工智能算法更新
人工智能算法特別是基于數(shù)據(jù)的算法,具有快速迭代更新的特性。人工智能算法更新屬于軟件更新范疇,故遵循軟件更新的基本原則及要求:人工智能算法更新若影響到人工智能醫(yī)療器械的安全性或有效性則屬于重大軟件更新,應(yīng)申請(qǐng)變更注冊(cè);反之,人工智能算法更新若未影響到人工智能醫(yī)療器械的安全性和有效性則屬于輕微軟件更新,通過(guò)質(zhì)量管理體系進(jìn)行控制,無(wú)需申請(qǐng)變更注冊(cè),待下次變更注冊(cè)時(shí)提交相應(yīng)注冊(cè)申報(bào)資料。
人工智能算法更新可分為算法驅(qū)動(dòng)型更新和數(shù)據(jù)驅(qū)動(dòng)型更新。其中,算法驅(qū)動(dòng)型更新是指人工智能醫(yī)療器械所用算法、算法結(jié)構(gòu)、算法流程、算法編程框架(詳見(jiàn)后文)、輸入輸出數(shù)據(jù)類(lèi)型等發(fā)生改變,通常屬于重大軟件更新。此外,算法重新訓(xùn)練即棄用原有訓(xùn)練數(shù)據(jù)而采用全新訓(xùn)練數(shù)據(jù)進(jìn)行算法訓(xùn)練,亦屬于算法驅(qū)動(dòng)型更新。
數(shù)據(jù)驅(qū)動(dòng)型更新是指僅由訓(xùn)練數(shù)據(jù)量增加而發(fā)生的算法更新。數(shù)據(jù)驅(qū)動(dòng)型更新是否屬于重大軟件更新原則上以算法性能評(píng)估結(jié)果(基于相同的測(cè)試集和算法性能評(píng)估指標(biāo))為準(zhǔn),算法性能評(píng)估結(jié)果若發(fā)生顯著性改變則屬于重大軟件更新,即算法性能評(píng)估結(jié)果與前次注冊(cè)(而非前次更新)相比存在統(tǒng)計(jì)學(xué)差異,反之屬于輕微軟件更新。
人工智能醫(yī)療器械其他類(lèi)型的算法更新、軟件更新以及重大軟件更新判定原則詳見(jiàn)醫(yī)療器械軟件指導(dǎo)原則、醫(yī)療器械網(wǎng)絡(luò)安全指導(dǎo)原則。
軟件版本命名規(guī)則原則上應(yīng)涵蓋算法驅(qū)動(dòng)型更新和數(shù)據(jù)驅(qū)動(dòng)型更新,明確并區(qū)分重大軟件更新和輕微軟件更新,其中重大軟件更新列舉常見(jiàn)典型情況。軟件版本命名規(guī)則的基本要求詳見(jiàn)醫(yī)療器械軟件指導(dǎo)原則、醫(yī)療器械網(wǎng)絡(luò)安全指導(dǎo)原則。
(一)基于算法特性
人工智能技術(shù)從發(fā)展驅(qū)動(dòng)要素角度是基于模型/數(shù)據(jù)和算力的算法,其中模型/數(shù)據(jù)是人工智能技術(shù)的基礎(chǔ),算力是人工智能技術(shù)的保證,算法是人工智能技術(shù)的核心。
由于算力所用計(jì)算資源本身不屬于監(jiān)管對(duì)象,計(jì)算資源的監(jiān)管要求取決于其所屬的計(jì)算平臺(tái)類(lèi)型。故從監(jiān)管角度出發(fā),人工智能醫(yī)療器械安全有效性評(píng)價(jià)基于其預(yù)期用途、使用場(chǎng)景、核心功能,以算法特性為核心重點(diǎn)關(guān)注其泛化能力,以模型/數(shù)據(jù)為基礎(chǔ)重點(diǎn)關(guān)注其質(zhì)控情況,同時(shí)從風(fēng)險(xiǎn)管理角度兼顧算力不足與失效的影響。
人工智能算法的類(lèi)型不同,其算法特性、適用場(chǎng)景也不同,評(píng)價(jià)重點(diǎn)亦有所側(cè)重;同時(shí),不同類(lèi)型的人工智能算法可組合使用,需結(jié)合各算法特性和算法組合形式進(jìn)行整體評(píng)價(jià)。因此,注冊(cè)申請(qǐng)人需結(jié)合人工智能醫(yī)療器械的預(yù)期用途、使用場(chǎng)景、核心功能選擇與之相適宜的人工智能算法或算法組合,基于算法特性并結(jié)合風(fēng)險(xiǎn)管理開(kāi)展相應(yīng)驗(yàn)證與確認(rèn)工作。
以深度學(xué)習(xí)為例,其是指通過(guò)訓(xùn)練具有多個(gè)隱層的神經(jīng)網(wǎng)絡(luò)而獲得輸入輸出映射關(guān)系的人工智能算法,亦是基于海量數(shù)據(jù)和高算力的黑盒算法,既可用于有監(jiān)督學(xué)習(xí)又可用于無(wú)監(jiān)督學(xué)習(xí)。因此,對(duì)于采用深度學(xué)習(xí)技術(shù)的人工智能醫(yī)療器械,基于其預(yù)期用途、使用場(chǎng)景、核心功能,重點(diǎn)關(guān)注其算法泛化能力、數(shù)據(jù)質(zhì)控、可解釋性等問(wèn)題,同時(shí),深度學(xué)習(xí)若與其他類(lèi)型的人工智能算法組合使用,還需基于各算法特性重點(diǎn)關(guān)注算法組合的整體評(píng)價(jià)問(wèn)題。
人工智能新算法研究處于深入發(fā)展階段,如基于小樣本數(shù)據(jù)、基于弱標(biāo)注數(shù)據(jù)、基于非結(jié)構(gòu)化數(shù)據(jù)、黑盒算法透明化等算法。人工智能醫(yī)療器械若使用人工智能新算法,亦需基于算法特性并結(jié)合風(fēng)險(xiǎn)管理開(kāi)展相應(yīng)驗(yàn)證與確認(rèn)工作,以保證產(chǎn)品的安全有效性。
(二)風(fēng)險(xiǎn)導(dǎo)向
人工智能醫(yī)療器械的風(fēng)險(xiǎn)水平亦可用軟件安全性級(jí)別進(jìn)行表述,軟件安全性級(jí)別越高,其生存周期質(zhì)控要求越嚴(yán)格,注冊(cè)申報(bào)資料越詳盡,同時(shí)由于全新類(lèi)型的潛在未知風(fēng)險(xiǎn)多于成熟類(lèi)型,故需結(jié)合成熟度予以綜合考慮,具體要求詳見(jiàn)醫(yī)療器械軟件指導(dǎo)原則。
人工智能醫(yī)療器械的軟件安全性級(jí)別可基于產(chǎn)品的預(yù)期用途、使用場(chǎng)景、核心功能進(jìn)行綜合判定,其中預(yù)期用途主要考慮用途類(lèi)型、重要程度、緊迫程度等因素,使用場(chǎng)景主要考慮使用場(chǎng)合、疾病特征、適用人群、目標(biāo)用戶(hù)等因素,核心功能主要考慮功能類(lèi)型、核心算法、輸入輸出、接口等因素。亦可根據(jù)風(fēng)險(xiǎn)管理所確定的風(fēng)險(xiǎn)等級(jí)進(jìn)行判定,軟件安全性級(jí)別與風(fēng)險(xiǎn)等級(jí)的分級(jí)可以不同,但二者存在對(duì)應(yīng)關(guān)系,因此可根據(jù)風(fēng)險(xiǎn)等級(jí)來(lái)判定軟件安全性級(jí)別,但應(yīng)在采取風(fēng)險(xiǎn)控制措施之前進(jìn)行判定。
人工智能醫(yī)療器械的主要風(fēng)險(xiǎn)從算法角度包括過(guò)擬合和欠擬合,其中過(guò)擬合是指算法對(duì)于訓(xùn)練數(shù)據(jù)過(guò)度學(xué)習(xí)而將非普遍規(guī)律作為重要特征,欠擬合是算法對(duì)于訓(xùn)練數(shù)據(jù)學(xué)習(xí)不充分而遺漏重要特征,均會(huì)降低算法泛化能力。從用途角度,輔助決策主要包括假陰性和假陽(yáng)性,其中假陰性即漏診,可能導(dǎo)致后續(xù)診療活動(dòng)延誤,特別是要考慮快速進(jìn)展疾病的診療活動(dòng)延誤風(fēng)險(xiǎn),而假陽(yáng)性即誤診,可能導(dǎo)致后續(xù)不必要的診療活動(dòng);非輔助決策從算法設(shè)計(jì)目標(biāo)能否得以實(shí)現(xiàn)角度,亦可參考輔助決策分為假陰性和假陽(yáng)性。此外,進(jìn)口人工智能醫(yī)療器械還需考慮中外差異風(fēng)險(xiǎn),如人種、流行病學(xué)特征、臨床診療規(guī)范等差異。
注冊(cè)申請(qǐng)人應(yīng)結(jié)合人工智能醫(yī)療器械的預(yù)期用途、使用場(chǎng)景、核心功能開(kāi)展風(fēng)險(xiǎn)管理活動(dòng),采取風(fēng)險(xiǎn)控制措施將風(fēng)險(xiǎn)降至可接受水平,并貫穿于人工智能醫(yī)療器械全生命周期過(guò)程。
(三)全生命周期質(zhì)控
注冊(cè)申請(qǐng)人應(yīng)結(jié)合質(zhì)量管理體系要求,參考軟件、人工智能相關(guān)標(biāo)準(zhǔn)和良好工程實(shí)踐,建立人工智能醫(yī)療器械生存周期過(guò)程,開(kāi)展與軟件安全性級(jí)別相匹配的產(chǎn)品質(zhì)量保證工作,將風(fēng)險(xiǎn)管理、可追溯分析貫穿于生存周期全程,形成記錄以供體系核查。
上市前開(kāi)展充分、適宜、有效的驗(yàn)證與確認(rèn)活動(dòng),保證算法泛化能力滿(mǎn)足用戶(hù)需求,識(shí)別可預(yù)見(jiàn)風(fēng)險(xiǎn)并將其降至可接受水平,明確產(chǎn)品使用限制(含技術(shù)限制,下同)和必要警示提示信息。上市后持續(xù)開(kāi)展算法泛化能力研究,同時(shí)結(jié)合用戶(hù)投訴、不良事件和召回等情況識(shí)別前期未預(yù)見(jiàn)的風(fēng)險(xiǎn),并采取有效的風(fēng)險(xiǎn)控制措施將風(fēng)險(xiǎn)降至可接受水平。此外,根據(jù)產(chǎn)品更新需求,經(jīng)評(píng)估后實(shí)施更新活動(dòng),開(kāi)展與之相適宜的驗(yàn)證與確認(rèn)活動(dòng),保證算法泛化能力持續(xù)滿(mǎn)足用戶(hù)需求。
人工智能醫(yī)療器械生存周期(又稱(chēng)生命周期)過(guò)程可基于軟件生存周期過(guò)程予以建立,具體要求詳見(jiàn)醫(yī)療器械獨(dú)立軟件生產(chǎn)質(zhì)量管理規(guī)范及其現(xiàn)場(chǎng)檢查指導(dǎo)原則。
考慮到有監(jiān)督深度學(xué)習(xí)是當(dāng)前人工智能醫(yī)療器械的主流算法,故本指導(dǎo)原則以有監(jiān)督深度學(xué)習(xí)為例詳述人工智能醫(yī)療器械生存周期過(guò)程質(zhì)控要求,主要包括需求分析、數(shù)據(jù)收集、算法設(shè)計(jì)、驗(yàn)證與確認(rèn)、更新控制等階段。其他類(lèi)型的人工智能算法可參照?qǐng)?zhí)行,不適用內(nèi)容詳述理由并予以記錄。
(一)需求分析
需求分析以用戶(hù)需求與風(fēng)險(xiǎn)為導(dǎo)向,結(jié)合產(chǎn)品的預(yù)期用途、使用場(chǎng)景、核心功能,綜合考慮法規(guī)、標(biāo)準(zhǔn)、用戶(hù)、產(chǎn)品、數(shù)據(jù)、功能、性能、接口、用戶(hù)界面、網(wǎng)絡(luò)安全、警示提示等需求,重點(diǎn)考慮數(shù)據(jù)收集、算法性能、使用限制等要求。
為保證數(shù)據(jù)質(zhì)量和控制數(shù)據(jù)偏倚,數(shù)據(jù)收集需考慮數(shù)據(jù)來(lái)源的合規(guī)性、充分性和多樣性,數(shù)據(jù)分布的科學(xué)性和合理性,數(shù)據(jù)質(zhì)控的充分性、有效性和準(zhǔn)確性。數(shù)據(jù)來(lái)源在合規(guī)性(如個(gè)人信息保護(hù)法)基礎(chǔ)上保證充分性和多樣性,以提高算法泛化能力,例如:根據(jù)產(chǎn)品的預(yù)期用途和使用場(chǎng)景盡可能多采集數(shù)據(jù),如來(lái)源于多家、多地域、多層級(jí)的代表性臨床機(jī)構(gòu),以及多家、多種、多參數(shù)的代表性采集設(shè)備。數(shù)據(jù)分布的科學(xué)性和合理性需結(jié)合目標(biāo)疾病流行病學(xué)特征予以考慮,包括但不限于疾病構(gòu)成(如分型、分級(jí)、分期)、人群分布(如健康、患者,性別、年齡、職業(yè)、地域、生活方式)、統(tǒng)計(jì)指標(biāo)(如發(fā)病率、患病率、治愈率、死亡率、生存率)等情況,以及目標(biāo)疾病并發(fā)癥與類(lèi)似疾病的影響情況。數(shù)據(jù)質(zhì)控的充分性、有效性和準(zhǔn)確性需結(jié)合數(shù)據(jù)采集與數(shù)據(jù)標(biāo)注的人員、設(shè)備、過(guò)程等影響因素予以考慮,具體要求詳見(jiàn)后文。
算法性能需結(jié)合醫(yī)療實(shí)際和產(chǎn)品定位,綜合考慮假陰性與假陽(yáng)性、重復(fù)性與再現(xiàn)性、魯棒性/健壯性、實(shí)時(shí)性等性能指標(biāo)的適用性及其要求,兼顧不同性能指標(biāo)的制約關(guān)系,如假陰性與假陽(yáng)性等。同時(shí),結(jié)合當(dāng)前醫(yī)療水平情況,考慮金標(biāo)準(zhǔn)或參考標(biāo)準(zhǔn)的確定依據(jù)、實(shí)現(xiàn)方法和質(zhì)控要求,以保證算法性能評(píng)估的準(zhǔn)確性,必要時(shí)納入數(shù)據(jù)收集過(guò)程。
使用限制需考慮產(chǎn)品禁用、慎用等場(chǎng)景,準(zhǔn)確表述產(chǎn)品使用場(chǎng)景,提供必要警示提示信息。
(二)數(shù)據(jù)收集
數(shù)據(jù)收集基于合規(guī)性要求,主要考慮數(shù)據(jù)采集、數(shù)據(jù)整理、數(shù)據(jù)標(biāo)注、數(shù)據(jù)集構(gòu)建等活動(dòng)的質(zhì)控要求,以保證數(shù)據(jù)質(zhì)量和算法訓(xùn)練效果。
1.數(shù)據(jù)采集
數(shù)據(jù)采集需考慮采集設(shè)備、采集過(guò)程、數(shù)據(jù)脫敏等質(zhì)控要求,并建立數(shù)據(jù)采集操作規(guī)范。數(shù)據(jù)采集亦可使用歷史數(shù)據(jù),需結(jié)合樣本規(guī)模、采集難度等影響因素合理選擇數(shù)據(jù)采集方式。若適用,數(shù)據(jù)采集需經(jīng)倫理委員會(huì)批準(zhǔn)。
采集設(shè)備質(zhì)控包括采集設(shè)備的兼容性和采集特征等要求。兼容性基于數(shù)據(jù)生成方式(直接生成、間接生成)考慮采集設(shè)備的兼容性要求,如采集設(shè)備的名稱(chēng)、型號(hào)規(guī)格、制造商、性能指標(biāo)等要求,若無(wú)需考慮兼容性要求詳述理由并予以記錄。采集特征考慮采集設(shè)備的采集方式(如常規(guī)成像、增強(qiáng)成像)、采集協(xié)議(如MRI成像序列)、采集參數(shù)(如CT加載電壓、加載電流、加載時(shí)間、層厚)、采集精度(如分辨率、采樣率)等要求。
采集過(guò)程質(zhì)控包括人員管理、采集流程、采集質(zhì)量評(píng)估等要求。人員管理考慮采集人員、審核人員的選拔(如職稱(chēng)、工作年限、工作經(jīng)驗(yàn)、所在機(jī)構(gòu),若有國(guó)外人員則需明確其資質(zhì)要求)、培訓(xùn)(如培訓(xùn)材料、培訓(xùn)方案)、考核(如方法、頻次、指標(biāo)、通過(guò)準(zhǔn)則、一致性)等要求。采集流程考慮人員職責(zé)、采集步驟、結(jié)果審核等要求。采集質(zhì)量評(píng)估考慮評(píng)估人員、評(píng)估方法、評(píng)估指標(biāo)、通過(guò)準(zhǔn)則等要求,并記錄評(píng)估結(jié)果。
數(shù)據(jù)采集若使用歷史數(shù)據(jù),需列明采集設(shè)備及采集特征要求,并開(kāi)展數(shù)據(jù)采集質(zhì)量評(píng)估工作。
采集的數(shù)據(jù)應(yīng)進(jìn)行數(shù)據(jù)脫敏以保護(hù)患者隱私,數(shù)據(jù)脫敏需明確脫敏的類(lèi)型(靜態(tài)、動(dòng)態(tài))、規(guī)則、方法以及脫敏內(nèi)容的確定依據(jù)。
脫敏數(shù)據(jù)匯總形成原始數(shù)據(jù)庫(kù),不同模態(tài)的數(shù)據(jù)在原始數(shù)據(jù)庫(kù)中需加以區(qū)分(下同)。原始數(shù)據(jù)庫(kù)需考慮樣本規(guī)模的充分性、樣本多樣性等問(wèn)題。
2.數(shù)據(jù)整理
數(shù)據(jù)整理基于原始數(shù)據(jù)庫(kù)考慮數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理的質(zhì)控要求。數(shù)據(jù)清洗需明確清洗的規(guī)則、方法、結(jié)果,數(shù)據(jù)預(yù)處理需明確處理的方法(如濾波、增強(qiáng)、重采樣、尺寸裁剪、均一化等)、結(jié)果。數(shù)據(jù)整理所用軟件工具(含腳本,下同)均需明確名稱(chēng)、型號(hào)規(guī)格、完整版本、制造商、運(yùn)行環(huán)境,并進(jìn)行軟件確認(rèn)。
數(shù)據(jù)經(jīng)整理后形成基礎(chǔ)數(shù)據(jù)庫(kù),需明確樣本類(lèi)型、樣本量、樣本分布等信息。樣本類(lèi)型以適用人群為單位可分為單一數(shù)據(jù)、數(shù)據(jù)序列(由多個(gè)單一數(shù)據(jù)組成,如結(jié)構(gòu)序列、功能序列、時(shí)間序列)。樣本量需考慮樣本規(guī)模的充分性,明確樣本總量及其確定依據(jù)。樣本分布需考慮樣本的科學(xué)性和合理性,依據(jù)適用人群、數(shù)據(jù)來(lái)源機(jī)構(gòu)、采集設(shè)備、樣本類(lèi)型等因素明確疾病構(gòu)成的數(shù)據(jù)分布情況。
3.數(shù)據(jù)標(biāo)注
數(shù)據(jù)標(biāo)注作為有監(jiān)督學(xué)習(xí)數(shù)據(jù)質(zhì)控的關(guān)鍵環(huán)節(jié),需建立數(shù)據(jù)標(biāo)注操作規(guī)范,明確標(biāo)注資源管理、標(biāo)注過(guò)程質(zhì)控、標(biāo)注質(zhì)量評(píng)估等要求。
標(biāo)注資源管理包括人員管理和基礎(chǔ)設(shè)施管理。人員管理考慮標(biāo)注人員、審核人員和仲裁人員的選拔(如職稱(chēng)、工作年限、工作經(jīng)驗(yàn)、所在機(jī)構(gòu),若有國(guó)外人員則需明確其資質(zhì)要求)、培訓(xùn)(如培訓(xùn)材料、培訓(xùn)方案)、考核(如方法、頻次、指標(biāo)、通過(guò)準(zhǔn)則、一致性)等要求。基礎(chǔ)設(shè)施管理考慮標(biāo)注場(chǎng)所(真實(shí)場(chǎng)所或模擬場(chǎng)所,模擬場(chǎng)所可根據(jù)產(chǎn)品實(shí)際情況調(diào)整模擬程度,詳述調(diào)整理由并予以記錄)、標(biāo)注環(huán)境條件(如空間、照明、溫度、濕度、氣壓)、標(biāo)注軟件(名稱(chēng)、型號(hào)規(guī)格、完整版本、制造商、運(yùn)行環(huán)境、軟件確認(rèn))等要求。
標(biāo)注過(guò)程質(zhì)控包括人員職責(zé)(如人員資質(zhì)、人員數(shù)量、職責(zé)分工)、標(biāo)注規(guī)則(如臨床指南、專(zhuān)家共識(shí)、專(zhuān)家評(píng)議、文獻(xiàn)分析)、標(biāo)注流程(如標(biāo)注對(duì)象、標(biāo)注形式、標(biāo)注輪次、標(biāo)注步驟、結(jié)果審核)、分歧處理(如仲裁人員、仲裁方式)、可追溯性(如數(shù)據(jù)、操作)等要求。
標(biāo)注質(zhì)量評(píng)估包括評(píng)估人員、評(píng)估方法、評(píng)估指標(biāo)、通過(guò)準(zhǔn)則等要求,并記錄評(píng)估結(jié)果。
數(shù)據(jù)經(jīng)標(biāo)注后形成標(biāo)注數(shù)據(jù)庫(kù),樣本類(lèi)型可分為數(shù)據(jù)塊(如圖像區(qū)域、數(shù)據(jù)片段)、單一數(shù)據(jù)(由多個(gè)數(shù)據(jù)塊組成)、數(shù)據(jù)序列(由多個(gè)單一數(shù)據(jù)組成)。標(biāo)注數(shù)據(jù)庫(kù)的樣本量、樣本分布等要求及風(fēng)險(xiǎn)考量與基礎(chǔ)數(shù)據(jù)庫(kù)相同。
數(shù)據(jù)標(biāo)注可使用自動(dòng)標(biāo)注軟件,但自動(dòng)標(biāo)注結(jié)果不得直接使用,應(yīng)由標(biāo)注人員審核后方可使用;同時(shí),自動(dòng)標(biāo)注軟件亦需明確名稱(chēng)、型號(hào)規(guī)格、完整版本、制造商、運(yùn)行環(huán)境等信息,并進(jìn)行軟件確認(rèn)。
4.數(shù)據(jù)集構(gòu)建
基于標(biāo)注數(shù)據(jù)庫(kù)構(gòu)建訓(xùn)練集(用于算法訓(xùn)練)、調(diào)優(yōu)集[人工智能領(lǐng)域稱(chēng)之為驗(yàn)證集(Validation set)。為避免與醫(yī)療器械領(lǐng)域所用術(shù)語(yǔ)驗(yàn)證(Verification)、確認(rèn)(Validation)相混淆,本指導(dǎo)原則將其改稱(chēng)為調(diào)優(yōu)集。](若有,用于算法超參數(shù)調(diào)優(yōu))、測(cè)試集(用于算法性能評(píng)估),明確訓(xùn)練集、調(diào)優(yōu)集、測(cè)試集的劃分方法、劃分依據(jù)、數(shù)據(jù)分配比例。訓(xùn)練集原則上需保證樣本分布具有均衡性,測(cè)試集、調(diào)優(yōu)集原則上需保證樣本分布符合真實(shí)情況,訓(xùn)練集、調(diào)優(yōu)集、測(cè)試集的樣本應(yīng)兩兩無(wú)交集并通過(guò)查重予以驗(yàn)證。
為解決樣本分布不滿(mǎn)足預(yù)期的問(wèn)題,可對(duì)訓(xùn)練集、調(diào)優(yōu)集小樣本量數(shù)據(jù)進(jìn)行擴(kuò)增,原則上不得對(duì)測(cè)試集進(jìn)行數(shù)據(jù)擴(kuò)增,對(duì)抗測(cè)試(詳見(jiàn)后文)除外。數(shù)據(jù)擴(kuò)增需明確擴(kuò)增的對(duì)象、范圍、方式(離線(xiàn)、在線(xiàn))、方法(如翻轉(zhuǎn)、旋轉(zhuǎn)、鏡像、平移、縮放、濾波、生成對(duì)抗網(wǎng)絡(luò)等)、倍數(shù),在線(xiàn)擴(kuò)增亦需予以記錄,擴(kuò)增需考慮數(shù)據(jù)偏倚的影響及風(fēng)險(xiǎn),如部分?jǐn)?shù)據(jù)擴(kuò)增倍數(shù)過(guò)大、數(shù)據(jù)擴(kuò)增倍數(shù)不均衡等。若采用生成對(duì)抗網(wǎng)絡(luò)(詳見(jiàn)后文)進(jìn)行數(shù)據(jù)擴(kuò)增,需明確算法基本信息以及算法選用依據(jù)。
數(shù)據(jù)經(jīng)擴(kuò)增后形成擴(kuò)增數(shù)據(jù)庫(kù),需列表對(duì)比擴(kuò)增數(shù)據(jù)庫(kù)與標(biāo)注數(shù)據(jù)庫(kù)在樣本量、樣本分布(注明擴(kuò)增倍數(shù))等差異,以證實(shí)擴(kuò)增數(shù)據(jù)庫(kù)樣本量的充分性以及樣本分布的合理性。
(三)算法設(shè)計(jì)
人工智能算法作為人工智能醫(yī)療器械的核心,其設(shè)計(jì)主要考慮算法選擇、算法訓(xùn)練、算法性能評(píng)估等要求。對(duì)于黑盒算法,算法設(shè)計(jì)應(yīng)開(kāi)展算法性能影響因素分析,同時(shí)建議與現(xiàn)有醫(yī)學(xué)知識(shí)[醫(yī)學(xué)知識(shí)作為醫(yī)療器械的外部參考準(zhǔn)則,其自身評(píng)價(jià)問(wèn)題不屬于醫(yī)療器械安全有效性評(píng)價(jià)范疇。]建立關(guān)聯(lián),以提升算法可解釋性。
1.算法選擇
算法選擇提供所用算法的名稱(chēng)、類(lèi)型(如有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí),基于模型、基于數(shù)據(jù),白盒、黑盒)、結(jié)構(gòu)(如層數(shù)、參數(shù)規(guī)模)、輸入輸出數(shù)據(jù)類(lèi)型、流程圖、算法編程框架、運(yùn)行環(huán)境等基本信息,并明確算法選用依據(jù),包括選用的理由和基本原則。
若組合使用集成學(xué)習(xí)、遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等,亦需提供算法基本信息以及算法選用依據(jù),詳見(jiàn)后文。
2.算法訓(xùn)練
算法訓(xùn)練需基于訓(xùn)練集、調(diào)優(yōu)集進(jìn)行訓(xùn)練和調(diào)優(yōu),考慮評(píng)估指標(biāo)、訓(xùn)練方式、訓(xùn)練目標(biāo)、調(diào)優(yōu)方式、訓(xùn)練數(shù)據(jù)量-評(píng)估指標(biāo)曲線(xiàn)等要求。
評(píng)估指標(biāo)建議根據(jù)用戶(hù)需求進(jìn)行選擇,輔助決策可選擇敏感性、特異性等指標(biāo),非輔助決策可選擇圖像質(zhì)量、測(cè)量準(zhǔn)確性等指標(biāo)。訓(xùn)練方式包括但不限于留出法和交叉驗(yàn)證法,若組合使用聯(lián)邦學(xué)習(xí)(詳見(jiàn)后文)亦需明確算法選用依據(jù),并提供算法基本信息。訓(xùn)練目標(biāo)根據(jù)醫(yī)療情況詳述目標(biāo)確定依據(jù),提供受試者工作特征(ROC)曲線(xiàn)或其衍生曲線(xiàn)、混淆矩陣及其衍生參數(shù)等證據(jù)予以證實(shí)。調(diào)優(yōu)方式明確優(yōu)化策略和實(shí)現(xiàn)方法。訓(xùn)練數(shù)據(jù)量-評(píng)估指標(biāo)曲線(xiàn)用于證實(shí)算法訓(xùn)練的充分性和有效性,若無(wú)法提供則需詳述理由并提供替代證據(jù)。
3.算法性能評(píng)估
算法性能評(píng)估作為軟件驗(yàn)證的重要組成部分,需基于測(cè)試集對(duì)算法設(shè)計(jì)結(jié)果進(jìn)行評(píng)估,綜合考慮假陰性與假陽(yáng)性、重復(fù)性與再現(xiàn)性、魯棒性/健壯性、實(shí)時(shí)性等適用評(píng)估要求,以證實(shí)算法性能滿(mǎn)足算法設(shè)計(jì)目標(biāo),并作為軟件驗(yàn)證、軟件確認(rèn)的基礎(chǔ)。亦可基于第三方數(shù)據(jù)庫(kù)(詳見(jiàn)后文)開(kāi)展算法性能評(píng)估。
同時(shí),開(kāi)展算法性能影響因素分析以提升算法可解釋性,詳述影響算法性能的主要因素及其影響程度,如采集設(shè)備、采集參數(shù)、疾病構(gòu)成、病變特征等因素,基于分析結(jié)果明確產(chǎn)品使用限制和必要警示提示信息。
此外,根據(jù)產(chǎn)品實(shí)際情況開(kāi)展壓力測(cè)試(詳見(jiàn)后文)、對(duì)抗測(cè)試等測(cè)試,以全面深入評(píng)估算法性能。
(四)驗(yàn)證與確認(rèn)
1.軟件驗(yàn)證
軟件驗(yàn)證是指通過(guò)提供客觀證據(jù)認(rèn)定軟件開(kāi)發(fā)、軟件更新某一階段的輸出滿(mǎn)足輸入要求,包括軟件驗(yàn)證測(cè)試(單元測(cè)試、集成測(cè)試、系統(tǒng)測(cè)試)、設(shè)計(jì)評(píng)審等系列活動(dòng)。
軟件驗(yàn)證基于軟件需求予以開(kāi)展,保證軟件的安全有效性,并作為軟件確認(rèn)的基礎(chǔ)。
2.軟件確認(rèn)
軟件確認(rèn)是指通過(guò)提供客觀證據(jù)認(rèn)定軟件滿(mǎn)足用戶(hù)需求和預(yù)期目的,包括軟件確認(rèn)測(cè)試(用戶(hù)測(cè)試)、臨床評(píng)價(jià)、設(shè)計(jì)評(píng)審等系列活動(dòng)。根據(jù)產(chǎn)品實(shí)際情況,軟件確認(rèn)方式可單一使用,亦可組合使用。
軟件確認(rèn)測(cè)試基于用戶(hù)需求,由預(yù)期用戶(hù)在真實(shí)或模擬使用場(chǎng)景下予以開(kāi)展,亦可基于測(cè)評(píng)數(shù)據(jù)庫(kù)(詳見(jiàn)后文)予以開(kāi)展。
臨床評(píng)價(jià)基本原則詳見(jiàn)醫(yī)療器械軟件指導(dǎo)原則,基于核心功能或核心算法,結(jié)合預(yù)期用途和成熟度予以綜合考慮:非輔助決策類(lèi)功能基于核心功能開(kāi)展同品種醫(yī)療器械比對(duì),全新的功能、算法和用途原則上均需開(kāi)展臨床評(píng)價(jià);輔助決策類(lèi)功能基于核心算法開(kāi)展同品種醫(yī)療器械比對(duì),所選同品種醫(yī)療器械的臨床證據(jù)原則上需基于臨床試驗(yàn)(含回顧性研究,下同),全新的功能、算法和用途原則上均需開(kāi)展臨床試驗(yàn)。具體要求詳見(jiàn)醫(yī)療器械臨床評(píng)價(jià)等通用指導(dǎo)原則,以及人工智能醫(yī)療器械臨床評(píng)價(jià)等專(zhuān)用指導(dǎo)原則。
同時(shí),開(kāi)展算法性能比較分析,若各類(lèi)測(cè)試場(chǎng)景(含臨床評(píng)價(jià))算法性能變異度較大,詳述原因并基于分析結(jié)果明確產(chǎn)品使用限制和必要警示提示信息。
最后,結(jié)合算法訓(xùn)練、算法性能評(píng)估、臨床評(píng)價(jià)等結(jié)果開(kāi)展算法性能綜合評(píng)價(jià),針對(duì)訓(xùn)練樣本量和測(cè)試樣本量過(guò)少、測(cè)試結(jié)果明顯低于算法設(shè)計(jì)目標(biāo)、算法性能變異度過(guò)大等情況,對(duì)產(chǎn)品的適用范圍、使用場(chǎng)景、核心功能進(jìn)行必要限制。
(五)更新控制
人工智能醫(yī)療器械若發(fā)生算法更新、軟件更新,均應(yīng)當(dāng)按照質(zhì)量管理體系的要求,開(kāi)展與算法更新、軟件更新的類(lèi)型、內(nèi)容和程度相適宜的驗(yàn)證與確認(rèn)活動(dòng),將風(fēng)險(xiǎn)管理、可追溯分析貫穿于更新全程,形成記錄以供體系核查。
對(duì)于算法更新,無(wú)論算法驅(qū)動(dòng)型更新還是數(shù)據(jù)驅(qū)動(dòng)型更新,均應(yīng)開(kāi)展相應(yīng)驗(yàn)證與確認(rèn)活動(dòng),如算法性能評(píng)估、臨床評(píng)價(jià)等,以保證算法更新的安全有效性。對(duì)于軟件更新,具體要求詳見(jiàn)醫(yī)療器械軟件指導(dǎo)原則、醫(yī)療器械獨(dú)立軟件生產(chǎn)質(zhì)量現(xiàn)場(chǎng)檢查指導(dǎo)原則。
此外,算法更新、軟件更新均需考慮引入回滾機(jī)制,以保證醫(yī)療業(yè)務(wù)的連續(xù)性,特別是對(duì)風(fēng)險(xiǎn)較高的軟件。
總之,人工智能醫(yī)療器械所含的每個(gè)人工智能算法或算法組合,均需獨(dú)立開(kāi)展需求分析、數(shù)據(jù)收集、算法設(shè)計(jì)、驗(yàn)證與確認(rèn)、更新控制等活動(dòng),同時(shí)考慮人工智能算法組合的整體評(píng)價(jià)要求,以保證產(chǎn)品的安全有效性。
前期已開(kāi)發(fā)的人工智能醫(yī)療器械若不滿(mǎn)足本指導(dǎo)原則的適用要求,應(yīng)開(kāi)展差距分析并予以記錄,明確產(chǎn)品使用限制和必要警示提示信息。必要時(shí)采取補(bǔ)救措施,以滿(mǎn)足質(zhì)量管理體系要求,并保證產(chǎn)品的安全有效性。
(一)注冊(cè)單元與檢測(cè)單元
人工智能醫(yī)療器械的注冊(cè)單元與檢測(cè)單元?jiǎng)澐衷瓌t詳見(jiàn)醫(yī)療器械軟件指導(dǎo)原則,人工智能獨(dú)立軟件、人工智能軟件組件分別參照獨(dú)立軟件、軟件組件的要求。
若軟件核心功能(即軟件在預(yù)期使用場(chǎng)景完成預(yù)期用途所必需的功能)相同,但核心算法(即實(shí)現(xiàn)軟件核心功能所必需的算法)類(lèi)型不同,則每類(lèi)核心算法所對(duì)應(yīng)的核心功能均需檢測(cè),即檢測(cè)對(duì)象為核心功能而非核心算法。
(二)網(wǎng)絡(luò)安全與數(shù)據(jù)安全
人工智能醫(yī)療器械需結(jié)合預(yù)期用途、使用場(chǎng)景、核心功能,基于保密性、完整性、可得性等網(wǎng)絡(luò)安全特性,確定網(wǎng)絡(luò)安全能力建設(shè)要求,以應(yīng)對(duì)網(wǎng)絡(luò)攻擊和數(shù)據(jù)竊取等網(wǎng)絡(luò)威脅,如算法編程框架漏洞攻擊、數(shù)據(jù)污染等。具體要求詳見(jiàn)醫(yī)療器械網(wǎng)絡(luò)安全指導(dǎo)原則。
除此之外,還需在人工智能醫(yī)療器械全生命周期過(guò)程中考慮數(shù)據(jù)安全問(wèn)題,包括上市前設(shè)計(jì)開(kāi)發(fā)階段和上市后使用階段。數(shù)據(jù)轉(zhuǎn)移需明確轉(zhuǎn)移方法、數(shù)據(jù)污染防護(hù)措施、數(shù)據(jù)銷(xiāo)毀等要求。數(shù)據(jù)整理、數(shù)據(jù)集構(gòu)建、算法訓(xùn)練、算法性能評(píng)估、軟件驗(yàn)證等內(nèi)部活動(dòng)需在封閉或受控的網(wǎng)絡(luò)環(huán)境下開(kāi)展以防止數(shù)據(jù)污染。數(shù)據(jù)標(biāo)注、軟件確認(rèn)等涉及外方的活動(dòng)需明確數(shù)據(jù)污染防護(hù)措施,特別是在開(kāi)放網(wǎng)絡(luò)環(huán)境下。各數(shù)據(jù)庫(kù)(集)均需進(jìn)行數(shù)據(jù)備份,明確備份的方法、頻次、數(shù)據(jù)恢復(fù)方法。數(shù)據(jù)采集、上市后使用需考慮醫(yī)療機(jī)構(gòu)關(guān)于網(wǎng)絡(luò)安全與數(shù)據(jù)安全的接口要求。
(三)移動(dòng)計(jì)算與云計(jì)算
人工智能醫(yī)療器械若使用移動(dòng)計(jì)算、云計(jì)算等技術(shù),則遵循相關(guān)指導(dǎo)原則要求。具體而言,移動(dòng)計(jì)算相關(guān)要求詳見(jiàn)移動(dòng)醫(yī)療器械指導(dǎo)原則,云計(jì)算相關(guān)要求詳見(jiàn)醫(yī)療器械軟件指導(dǎo)原則,移動(dòng)計(jì)算與云計(jì)算的網(wǎng)絡(luò)安全相關(guān)要求詳見(jiàn)醫(yī)療器械網(wǎng)絡(luò)安全指導(dǎo)原則。
(四)人因與可用性
建議加強(qiáng)人工智能醫(yī)療器械的人因設(shè)計(jì)以提升可用性,將用戶(hù)錯(cuò)誤使用的風(fēng)險(xiǎn)降至可接受水平,特別是軟件用戶(hù)界面。具體要求詳見(jiàn)醫(yī)療器械人因設(shè)計(jì)相關(guān)指導(dǎo)原則。
(五)壓力測(cè)試
本指導(dǎo)原則所述壓力測(cè)試[與軟件工程領(lǐng)域的壓力測(cè)試含義不同。]是指采用罕見(jiàn)或特殊的真實(shí)數(shù)據(jù)樣本開(kāi)展的算法性能測(cè)試,側(cè)重于評(píng)估算法泛化能力的極限。
注冊(cè)申請(qǐng)人需根據(jù)產(chǎn)品實(shí)際情況開(kāi)展壓力測(cè)試,以全面深入評(píng)估算法性能,必要時(shí)可引入對(duì)抗樣本開(kāi)展對(duì)抗壓力測(cè)試。若未開(kāi)展相應(yīng)測(cè)試或測(cè)試結(jié)果不佳,均需對(duì)產(chǎn)品的適用范圍、使用場(chǎng)景、核心功能進(jìn)行必要限制,并在說(shuō)明書(shū)中明確產(chǎn)品使用限制和必要警示提示信息。
(六)對(duì)抗測(cè)試
本指導(dǎo)原則所述對(duì)抗測(cè)試是指基于真實(shí)數(shù)據(jù)樣本利用數(shù)據(jù)擾動(dòng)、生成對(duì)抗網(wǎng)絡(luò)等技術(shù)產(chǎn)生對(duì)抗樣本,并采用對(duì)抗樣本開(kāi)展的算法性能測(cè)試,側(cè)重于評(píng)估算法的魯棒性/健壯性。
若條件具備,建議注冊(cè)申請(qǐng)人開(kāi)展對(duì)抗測(cè)試,以全面深入評(píng)估算法性能。若未開(kāi)展相應(yīng)測(cè)試或測(cè)試結(jié)果不佳,均需明確產(chǎn)品使用限制和必要警示提示信息。
(七)第三方數(shù)據(jù)庫(kù)
第三方數(shù)據(jù)庫(kù)可用于算法性能評(píng)估,但其類(lèi)型、用途等情況各不相同,未必能夠完全滿(mǎn)足軟件確認(rèn)測(cè)試的要求。因此,使用第三方數(shù)據(jù)庫(kù)進(jìn)行軟件確認(rèn)測(cè)試,需評(píng)估其滿(mǎn)足軟件確認(rèn)測(cè)試的充分性、適宜性和有效性。
可用于軟件確認(rèn)測(cè)試的第三方數(shù)據(jù)庫(kù)即為測(cè)評(píng)數(shù)據(jù)庫(kù)。測(cè)評(píng)數(shù)據(jù)庫(kù)除滿(mǎn)足數(shù)據(jù)庫(kù)通用要求(如數(shù)據(jù)管理、網(wǎng)絡(luò)安全與數(shù)據(jù)安全、可擴(kuò)展性)外,還應(yīng)滿(mǎn)足以下專(zhuān)用要求。
1.權(quán)威性:測(cè)評(píng)數(shù)據(jù)庫(kù)的數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注及其質(zhì)控工作由相應(yīng)臨床專(zhuān)業(yè)領(lǐng)域的權(quán)威機(jī)構(gòu)(如國(guó)家臨床醫(yī)學(xué)研究中心等)負(fù)責(zé),以保證數(shù)據(jù)準(zhǔn)確性;標(biāo)注人員、審核人員、仲裁人員需具備與其崗位職責(zé)相匹配的臨床實(shí)踐經(jīng)驗(yàn),以保證數(shù)據(jù)質(zhì)量。
2.科學(xué)性:測(cè)評(píng)數(shù)據(jù)庫(kù)的數(shù)據(jù)樣本均為臨床真實(shí)數(shù)據(jù),不得進(jìn)行數(shù)據(jù)擴(kuò)增;樣本分布符合目標(biāo)疾病流行病學(xué)特征情況,樣本總量基于目標(biāo)疾病流行病學(xué)統(tǒng)計(jì)指標(biāo)、測(cè)試抽樣誤差控制要求,通過(guò)統(tǒng)計(jì)學(xué)計(jì)算予以確定;單次測(cè)試原則上根據(jù)測(cè)評(píng)數(shù)據(jù)庫(kù)樣本分布情況等比例隨機(jī)抽取測(cè)試樣本,且其樣本量滿(mǎn)足測(cè)試抽樣誤差控制要求。
3.規(guī)范性:測(cè)評(píng)數(shù)據(jù)庫(kù)的數(shù)據(jù)采集、數(shù)據(jù)脫敏、數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注、數(shù)據(jù)更換、數(shù)據(jù)管理、數(shù)據(jù)安全保證、數(shù)據(jù)備份等數(shù)據(jù)治理活動(dòng)以及測(cè)評(píng)活動(dòng)均需建立質(zhì)控程序文件,并滿(mǎn)足可追溯性要求。
4.多樣性:測(cè)評(píng)數(shù)據(jù)庫(kù)的樣本需來(lái)源于多家、多地域、多層級(jí)的代表性臨床機(jī)構(gòu)以及多家、多種、多參數(shù)的代表性采集設(shè)備,以保證數(shù)據(jù)多樣性能夠滿(mǎn)足算法泛化能力評(píng)估要求;若條件具備,測(cè)評(píng)數(shù)據(jù)庫(kù)可包含適當(dāng)比例的罕見(jiàn)或特殊的臨床真實(shí)數(shù)據(jù)樣本,以便開(kāi)展壓力測(cè)試深入評(píng)估算法泛化能力的極限。
5.封閉性:測(cè)評(píng)數(shù)據(jù)庫(kù)需封閉管理,樣本總量需遠(yuǎn)大于單次測(cè)試樣本量,測(cè)評(píng)活動(dòng)亦需封閉管理,以保證算法性能評(píng)價(jià)的客觀性、公正性、公平性。
6.動(dòng)態(tài)性:測(cè)評(píng)數(shù)據(jù)庫(kù)需定期補(bǔ)充或更換一定比例的數(shù)據(jù)樣本,以保證其具備持續(xù)的科學(xué)性、多樣性和封閉性以及數(shù)據(jù)的時(shí)效性;數(shù)據(jù)補(bǔ)充或更換的頻率、比例需有確定依據(jù),并滿(mǎn)足規(guī)范性要求。更換出庫(kù)的數(shù)據(jù)樣本由測(cè)評(píng)數(shù)據(jù)庫(kù)責(zé)任方自行確定其處理方案。
基于測(cè)評(píng)數(shù)據(jù)庫(kù),利用數(shù)據(jù)擾動(dòng)、生成對(duì)抗網(wǎng)絡(luò)等技術(shù),可衍生出對(duì)抗測(cè)評(píng)數(shù)據(jù)庫(kù)。若條件具備,建議基于測(cè)評(píng)數(shù)據(jù)庫(kù)建設(shè)對(duì)抗測(cè)評(píng)數(shù)據(jù)庫(kù),以全面深入評(píng)價(jià)算法性能。
注冊(cè)申請(qǐng)人可依據(jù)上述專(zhuān)用要求對(duì)第三方數(shù)據(jù)庫(kù)進(jìn)行篩選,若第三方數(shù)據(jù)庫(kù)能用作測(cè)評(píng)數(shù)據(jù)庫(kù)(含對(duì)抗測(cè)評(píng)數(shù)據(jù)庫(kù),下同)則可用于軟件確認(rèn)測(cè)試,并在產(chǎn)品注冊(cè)申報(bào)時(shí)按醫(yī)療器械主文檔登記事項(xiàng)要求提交測(cè)評(píng)數(shù)據(jù)庫(kù)評(píng)估材料。
公開(kāi)數(shù)據(jù)庫(kù)因不具備封閉性而不能用作測(cè)評(píng)數(shù)據(jù)庫(kù),但可用于算法性能評(píng)估,若用于算法訓(xùn)練需重新進(jìn)行質(zhì)量評(píng)估。使用公開(kāi)數(shù)據(jù)庫(kù)需根據(jù)其使用情況開(kāi)展必要評(píng)估工作,并在注冊(cè)申報(bào)資料中予以說(shuō)明。
其他類(lèi)型第三方數(shù)據(jù)庫(kù)可參照測(cè)評(píng)數(shù)據(jù)庫(kù)和公開(kāi)數(shù)據(jù)庫(kù)的要求予以使用,同時(shí)考慮其適用場(chǎng)景、數(shù)據(jù)質(zhì)量評(píng)估、時(shí)效性等要求。
(八)白盒算法
白盒算法的特征提取需要人為干預(yù),可與現(xiàn)有醫(yī)學(xué)知識(shí)建立關(guān)聯(lián),可解釋性高,通常為基于模型的算法。
對(duì)于此類(lèi)算法,有監(jiān)督學(xué)習(xí)的模型/數(shù)據(jù)質(zhì)控要求參照有監(jiān)督深度學(xué)習(xí)執(zhí)行,不適用內(nèi)容詳述理由并予以記錄。同理,無(wú)監(jiān)督學(xué)習(xí)的模型/數(shù)據(jù)質(zhì)控要求亦參照有監(jiān)督深度學(xué)習(xí)執(zhí)行,其中數(shù)據(jù)標(biāo)注不適用,其余不適用內(nèi)容詳述理由并予以記錄。
此類(lèi)算法無(wú)論有監(jiān)督學(xué)習(xí)還是無(wú)監(jiān)督學(xué)習(xí),均需明確特征信息,如特征分類(lèi)(如人口統(tǒng)計(jì)學(xué)、生物學(xué)、形態(tài)學(xué))、特征屬性(如形態(tài)、紋理、性質(zhì)、尺寸、邊界)、特征展現(xiàn)方式(如形狀、尺寸、邊界、顏色、數(shù)量)等信息。
(九)集成學(xué)習(xí)
集成學(xué)習(xí)是指產(chǎn)生多個(gè)基學(xué)習(xí)器并以某種結(jié)合策略將基學(xué)習(xí)器進(jìn)行集成的人工智能算法。集成學(xué)習(xí)從不同角度具有不同類(lèi)型劃分維度,如同質(zhì)和異質(zhì)的基學(xué)習(xí)器集成算法、串行和并行的集成算法等,并可與深度學(xué)習(xí)等人工智能算法組合使用。
人工智能醫(yī)療器械若使用集成學(xué)習(xí)算法,注冊(cè)申報(bào)資料需明確算法的名稱(chēng)、類(lèi)型、輸入輸出、流程圖、運(yùn)行環(huán)境等基本信息以及算法選用依據(jù),并根據(jù)集成學(xué)習(xí)類(lèi)型及其算法特性提供算法驗(yàn)證與確認(rèn)資料。
(十)遷移學(xué)習(xí)
遷移學(xué)習(xí)是指將在某領(lǐng)域或任務(wù)學(xué)習(xí)到的模型應(yīng)用于不同但相關(guān)的領(lǐng)域或任務(wù)的人工智能算法,如將在自然圖像領(lǐng)域?qū)W習(xí)形成的模型應(yīng)用于醫(yī)學(xué)圖像領(lǐng)域。遷移學(xué)習(xí)主要包括基于特征和基于模型的算法,并可與深度學(xué)習(xí)、聯(lián)邦學(xué)習(xí)等人工智能算法組合使用。
人工智能醫(yī)療器械若使用遷移學(xué)習(xí)算法,注冊(cè)申報(bào)資料需明確算法的名稱(chēng)、類(lèi)型、輸入輸出、流程圖、運(yùn)行環(huán)境等基本信息以及算法選用依據(jù),并根據(jù)遷移學(xué)習(xí)的類(lèi)型及其算法特性提供預(yù)訓(xùn)練模型的數(shù)據(jù)集構(gòu)建、算法測(cè)試等資料。
(十一)強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)是指基于行動(dòng)與環(huán)境的交互,實(shí)現(xiàn)行動(dòng)從環(huán)境所獲累積獎(jiǎng)勵(lì)最大化的人工智能算法,采用“試錯(cuò)”的學(xué)習(xí)策略。強(qiáng)化學(xué)習(xí)從不同角度具有不同類(lèi)型劃分維度,如有模型與無(wú)模型的算法、基于策略和基于價(jià)值的算法等,并可與深度學(xué)習(xí)等人工智能算法組合使用。
人工智能醫(yī)療器械若使用強(qiáng)化學(xué)習(xí)算法,注冊(cè)申報(bào)資料需明確算法的名稱(chēng)、類(lèi)型、輸入輸出、流程圖、運(yùn)行環(huán)境等基本信息以及算法選用依據(jù),并根據(jù)強(qiáng)化學(xué)習(xí)類(lèi)型及其算法特性提供算法驗(yàn)證與確認(rèn)資料。
(十二)聯(lián)邦學(xué)習(xí)
聯(lián)邦學(xué)習(xí)是基于多個(gè)數(shù)據(jù)源協(xié)同建立學(xué)習(xí)模型的人工智能算法,即每個(gè)數(shù)據(jù)源獨(dú)立進(jìn)行本地?cái)?shù)據(jù)學(xué)習(xí),通過(guò)交換數(shù)據(jù)模型共同建立學(xué)習(xí)模型,實(shí)為分布式算法訓(xùn)練技術(shù),亦屬于隱私計(jì)算技術(shù)。聯(lián)邦學(xué)習(xí)主要包括橫向聯(lián)邦(基于樣本)和縱向聯(lián)邦(基于特征)等算法,并可與遷移學(xué)習(xí)等人工智能算法組合使用。
人工智能醫(yī)療器械若使用聯(lián)邦學(xué)習(xí)算法等隱私計(jì)算技術(shù)進(jìn)行算法訓(xùn)練,注冊(cè)申報(bào)資料需明確算法的名稱(chēng)、類(lèi)型、輸入輸出、流程圖、運(yùn)行環(huán)境等基本信息以及算法選用依據(jù),并根據(jù)聯(lián)邦學(xué)習(xí)等隱私計(jì)算技術(shù)的算法類(lèi)型及其算法特性提供算法驗(yàn)證與確認(rèn)資料。
(十三)生成對(duì)抗網(wǎng)絡(luò)
生成對(duì)抗網(wǎng)絡(luò)是通過(guò)生成器和判別器的互相博弈學(xué)習(xí)而產(chǎn)生與真實(shí)數(shù)據(jù)類(lèi)似樣本的人工智能算法,主要用于數(shù)據(jù)擴(kuò)增、對(duì)抗測(cè)試的樣本生成(詳見(jiàn)前文),并可與深度學(xué)習(xí)等人工智能算法組合使用。
人工智能醫(yī)療器械若使用生成對(duì)抗網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)擴(kuò)增、對(duì)抗樣本生成,注冊(cè)申報(bào)資料需明確算法的名稱(chēng)、類(lèi)型、輸入輸出、流程圖、運(yùn)行環(huán)境等基本信息以及算法選用依據(jù),并根據(jù)生成對(duì)抗網(wǎng)絡(luò)類(lèi)型及其算法特性提供算法測(cè)試資料。此時(shí),建議開(kāi)展對(duì)抗測(cè)試。
(十四)持續(xù)學(xué)習(xí)/自適應(yīng)學(xué)習(xí)
持續(xù)學(xué)習(xí)/自適應(yīng)學(xué)習(xí)具備自學(xué)習(xí)能力,部署后可通過(guò)持續(xù)學(xué)習(xí)用戶(hù)數(shù)據(jù)而進(jìn)行產(chǎn)品快速更新。此時(shí),用戶(hù)亦成為產(chǎn)品開(kāi)發(fā)者,與注冊(cè)申請(qǐng)人共同承擔(dān)產(chǎn)品質(zhì)量責(zé)任和法律責(zé)任;同時(shí),此種更新對(duì)于產(chǎn)品安全有效性的影響具有高度不確定性,特別是基于數(shù)據(jù)的無(wú)監(jiān)督學(xué)習(xí)。
因此,在當(dāng)前法律法規(guī)體系和技術(shù)水平條件下,持續(xù)學(xué)習(xí)/自適應(yīng)學(xué)習(xí)應(yīng)關(guān)閉自學(xué)習(xí)功能,或者雖開(kāi)放自學(xué)習(xí)功能但不得投入使用,即用戶(hù)始終使用產(chǎn)品原有功能,自學(xué)習(xí)功能僅用于算法訓(xùn)練或醫(yī)學(xué)科研。
注冊(cè)申請(qǐng)人應(yīng)按照質(zhì)量管理體系要求,對(duì)自學(xué)習(xí)功能所產(chǎn)生的產(chǎn)品更新的安全有效性進(jìn)行驗(yàn)證與確認(rèn),必要時(shí)申請(qǐng)變更注冊(cè),待批準(zhǔn)后方能將自學(xué)習(xí)功能所產(chǎn)生的產(chǎn)品更新投入使用。
(十五)人工智能算法編程框架
人工智能算法編程框架(以下簡(jiǎn)稱(chēng)算法框架)從開(kāi)發(fā)者角度可分為自研算法框架和現(xiàn)成算法框架,其中自研算法框架即注冊(cè)申請(qǐng)人自行研發(fā)的人工智能算法框架,屬于自研軟件;現(xiàn)成算法框架是指注冊(cè)申請(qǐng)人所使用的由第三方開(kāi)發(fā)的人工智能算法框架,視為現(xiàn)成軟件,現(xiàn)成算法框架開(kāi)發(fā)者視為醫(yī)療器械供應(yīng)商。
算法框架更新包括產(chǎn)品更新(即更換算法框架)、版本更新、補(bǔ)丁更新,其中產(chǎn)品更新、非效率型版本更新對(duì)于人工智能醫(yī)療器械而言屬于重大軟件更新,效率型版本更新(即運(yùn)算效率單純提高)、補(bǔ)丁更新對(duì)于人工智能醫(yī)療器械而言通常屬于輕微軟件更新,除非影響到人工智能醫(yī)療器械的安全性或有效性。算法框架同時(shí)發(fā)生多種類(lèi)型的更新,同樣遵循風(fēng)險(xiǎn)從高原則。
算法框架可參照自研軟件、現(xiàn)成軟件相關(guān)要求提交相應(yīng)注冊(cè)申報(bào)資料,均需明確算法框架的名稱(chēng)、類(lèi)型(自研算法框架、現(xiàn)成算法框架)、型號(hào)規(guī)格、完整版本、制造商等信息。算法框架若基于云計(jì)算平臺(tái),相關(guān)要求詳見(jiàn)前文關(guān)于云計(jì)算的要求。
(十六)人工智能芯片
人工智能芯片作為計(jì)算資源的組成部分,本身不屬于監(jiān)管對(duì)象,根據(jù)其所屬的計(jì)算平臺(tái)類(lèi)型考慮監(jiān)管要求。對(duì)于人工智能獨(dú)立軟件,人工智能芯片作為通用計(jì)算平臺(tái)的組成部分,不屬于產(chǎn)品結(jié)構(gòu)組成,按照運(yùn)行環(huán)境予以考慮。對(duì)于人工智能軟件組件,人工智能芯片作為醫(yī)用計(jì)算平臺(tái)的組成部分,屬于產(chǎn)品結(jié)構(gòu)組成,與產(chǎn)品進(jìn)行整體評(píng)價(jià)。
無(wú)論何種情況,使用人工智能芯片均需在注冊(cè)申報(bào)資料中明確其名稱(chēng)、型號(hào)規(guī)格、制造商、性能指標(biāo)等信息。
(一)算法研究報(bào)告
算法研究報(bào)告適用于人工智能算法或算法組合的初次發(fā)布和再次發(fā)布,包括算法基本信息、算法風(fēng)險(xiǎn)管理、算法需求規(guī)范、數(shù)據(jù)質(zhì)控、算法訓(xùn)練、算法驗(yàn)證與確認(rèn)、算法可追溯性分析、結(jié)論等內(nèi)容,不適用內(nèi)容詳述理由。
1.算法基本信息
明確算法的名稱(chēng)、類(lèi)型、結(jié)構(gòu)、輸入輸出、流程圖、算法框架、運(yùn)行環(huán)境等基本信息以及算法選用依據(jù)。
其中,算法類(lèi)型從學(xué)習(xí)策略、學(xué)習(xí)方法、可解釋性等角度明確算法特性。算法結(jié)構(gòu)明確算法的層數(shù)、參數(shù)規(guī)模等超參數(shù)信息。算法框架明確所用人工智能算法框架的基本信息,包括名稱(chēng)、類(lèi)型(自研算法框架、現(xiàn)成算法框架)、型號(hào)規(guī)格、完整版本、制造商等信息;若基于云計(jì)算平臺(tái),明確云計(jì)算的名稱(chēng)、服務(wù)模式、部署模式、配置以及云服務(wù)商的名稱(chēng)、住所、服務(wù)資質(zhì)。運(yùn)行環(huán)境明確算法正常運(yùn)行所需的典型運(yùn)行環(huán)境,包括硬件配置、外部軟件環(huán)境、網(wǎng)絡(luò)條件;若使用人工智能芯片需明確其名稱(chēng)、型號(hào)規(guī)格、制造商、性能指標(biāo)等信息。算法選用依據(jù)詳述人工智能算法或算法組合選用的理由和基本原則。
2.算法風(fēng)險(xiǎn)管理
明確算法的軟件安全性級(jí)別(輕微、中等、嚴(yán)重)并詳述判定理由。提供算法風(fēng)險(xiǎn)管理資料,明確過(guò)擬合與欠擬合、假陰性與假陽(yáng)性、數(shù)據(jù)污染與數(shù)據(jù)偏倚(如數(shù)據(jù)擴(kuò)增)等風(fēng)險(xiǎn)的控制措施。若無(wú)單獨(dú)文檔可提供軟件風(fēng)險(xiǎn)管理資料,并注明算法風(fēng)險(xiǎn)管理所在位置。
3.算法需求規(guī)范
提供算法需求規(guī)范文檔,若無(wú)單獨(dú)文檔可提供軟件需求規(guī)范,并注明算法需求所在位置。
4.數(shù)據(jù)質(zhì)控
提供數(shù)據(jù)來(lái)源合規(guī)性聲明,列明數(shù)據(jù)來(lái)源機(jī)構(gòu)的名稱(chēng)、所在地域、數(shù)據(jù)收集量、倫理批件(或科研合作協(xié)議)編號(hào)等信息。
提供數(shù)據(jù)采集操作規(guī)范文檔,根據(jù)數(shù)據(jù)采集方式明確采集設(shè)備、采集過(guò)程、數(shù)據(jù)脫敏等質(zhì)控要求。
概述數(shù)據(jù)整理情況,明確數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理的質(zhì)控要求。
提供數(shù)據(jù)標(biāo)注操作規(guī)范文檔,明確標(biāo)注資源管理、標(biāo)注過(guò)程質(zhì)控、標(biāo)注質(zhì)量評(píng)估、數(shù)據(jù)安全保證等要求。
若適用,提供數(shù)據(jù)擴(kuò)增情況說(shuō)明,明確擴(kuò)增的對(duì)象、方式、方法、倍數(shù)等信息。
依據(jù)適用人群、數(shù)據(jù)來(lái)源機(jī)構(gòu)、采集設(shè)備、樣本類(lèi)型等因素,提供原始數(shù)據(jù)庫(kù)、基礎(chǔ)數(shù)據(jù)庫(kù)、標(biāo)注數(shù)據(jù)庫(kù)、擴(kuò)增數(shù)據(jù)庫(kù)關(guān)于疾病構(gòu)成的數(shù)據(jù)分布情況。
若數(shù)據(jù)來(lái)自公開(kāi)數(shù)據(jù)庫(kù),提供公開(kāi)數(shù)據(jù)庫(kù)的基本信息(如名稱(chēng)、創(chuàng)建者、數(shù)據(jù)總量等)和使用情況(如數(shù)據(jù)使用量、數(shù)據(jù)質(zhì)量評(píng)估、數(shù)據(jù)分布等)。
5.算法訓(xùn)練
依據(jù)適用人群、數(shù)據(jù)來(lái)源機(jī)構(gòu)、采集設(shè)備、樣本類(lèi)型等因素,提供訓(xùn)練集、調(diào)優(yōu)集(若有)關(guān)于疾病構(gòu)成的數(shù)據(jù)分布情況。
明確算法訓(xùn)練所用的評(píng)估指標(biāo)、訓(xùn)練方式、訓(xùn)練目標(biāo)、調(diào)優(yōu)方式(若有),提供ROC曲線(xiàn)或混淆矩陣等證據(jù)證明訓(xùn)練目標(biāo)滿(mǎn)足醫(yī)療要求,提供訓(xùn)練數(shù)據(jù)量-評(píng)估指標(biāo)曲線(xiàn)等證據(jù)以證實(shí)算法訓(xùn)練的充分性和有效性。
6.算法驗(yàn)證與確認(rèn)
依據(jù)適用人群、數(shù)據(jù)來(lái)源機(jī)構(gòu)、采集設(shè)備、樣本類(lèi)型等因素,提供測(cè)試集關(guān)于疾病構(gòu)成的數(shù)據(jù)分布情況。
提供假陰性與假陽(yáng)性、重復(fù)性與再現(xiàn)性、魯棒性/健壯性、實(shí)時(shí)性等適用指標(biāo)的算法性能評(píng)估結(jié)果,以證明算法性能滿(mǎn)足算法設(shè)計(jì)目標(biāo)。
若使用第三方數(shù)據(jù)庫(kù)開(kāi)展算法性能評(píng)估,提供第三方數(shù)據(jù)庫(kù)的基本信息(如名稱(chēng)、創(chuàng)建者、數(shù)據(jù)總量等)和使用情況(如測(cè)試數(shù)據(jù)樣本量、評(píng)估指標(biāo)、評(píng)估結(jié)果等)。
若適用,提供算法性能影響因素分析報(bào)告,明確影響算法性能的主要因素及其影響程度,以及產(chǎn)品使用限制和必要警示提示信息。
若適用,提供壓力測(cè)試、對(duì)抗測(cè)試等測(cè)試報(bào)告。若未開(kāi)展相應(yīng)測(cè)試或測(cè)試結(jié)果不佳,均需明確產(chǎn)品使用限制和必要警示提示信息。
若基于測(cè)評(píng)數(shù)據(jù)庫(kù)進(jìn)行算法確認(rèn),提供測(cè)評(píng)數(shù)據(jù)庫(kù)的基本信息(如名稱(chēng)、創(chuàng)建者、數(shù)據(jù)總量等)、評(píng)估情況(如評(píng)估方法、評(píng)估指標(biāo)、評(píng)估結(jié)果等)、使用情況(如評(píng)估指標(biāo)、評(píng)估結(jié)果等)。若基于臨床評(píng)價(jià)方式進(jìn)行算法確認(rèn),指向臨床評(píng)價(jià)資料即可。
提供上述各類(lèi)測(cè)試場(chǎng)景(含臨床評(píng)價(jià))下的算法性能評(píng)估結(jié)果比較分析報(bào)告,明確產(chǎn)品使用限制和必要警示提示信息。
7.算法可追溯性分析
提供算法可追溯性分析報(bào)告,即追溯算法需求、算法設(shè)計(jì)、源代碼(明確軟件單元名稱(chēng)即可)、算法測(cè)試、算法風(fēng)險(xiǎn)管理的關(guān)系表。
若無(wú)單獨(dú)文檔可提供軟件可追溯性分析報(bào)告,并注明算法可追溯性分析所在位置。
8.結(jié)論
簡(jiǎn)述算法性能綜合評(píng)價(jià)結(jié)果,明確對(duì)產(chǎn)品的適用范圍、使用場(chǎng)景、核心功能所做的必要限制,并判定人工智能算法或算法組合的安全有效性是否滿(mǎn)足要求。
(二)算法更新研究報(bào)告
算法更新研究報(bào)告僅適用于人工智能算法或算法組合的再次發(fā)布,在算法研究報(bào)告相應(yīng)內(nèi)容中明確算法更新情況。
其中,算法基本信息描述申報(bào)算法情況,若適用詳述與前次注冊(cè)相比的變化情況;算法風(fēng)險(xiǎn)管理、算法需求規(guī)范、數(shù)據(jù)質(zhì)控、算法訓(xùn)練、算法驗(yàn)證與確認(rèn)、算法可追溯性分析描述算法更新的具體情況;結(jié)論簡(jiǎn)述算法性能綜合評(píng)價(jià)結(jié)果,并判定人工智能算法或算法組合更新的安全有效性是否滿(mǎn)足要求。
考慮到算法更新具有累積效應(yīng),算法更新研究報(bào)告需涵蓋人工智能醫(yī)療器械自前次注冊(cè)(延續(xù)注冊(cè)除外)以來(lái)算法更新的全部?jī)?nèi)容。
注冊(cè)申報(bào)資料在符合醫(yī)療器械注冊(cè)申報(bào)資料要求等文件要求基礎(chǔ)上,滿(mǎn)足醫(yī)療器械軟件、醫(yī)療器械網(wǎng)絡(luò)安全、移動(dòng)醫(yī)療器械等相關(guān)指導(dǎo)原則要求,同時(shí)重點(diǎn)關(guān)注以下要求。
(一)產(chǎn)品注冊(cè)
1.申請(qǐng)表信息
(1)人工智能獨(dú)立軟件
產(chǎn)品名稱(chēng)應(yīng)符合通用名稱(chēng)命名規(guī)范要求,通常體現(xiàn)輸入數(shù)據(jù)(如CT圖像、眼底照片)、目標(biāo)疾?。ê∽?、疾病的屬性)、預(yù)期用途(如輔助分診、輔助評(píng)估、輔助檢測(cè)、輔助診斷)等特征詞。
結(jié)構(gòu)組成所述功能模塊需保證用語(yǔ)的規(guī)范性,若采用人工智能算法需體現(xiàn)核心算法名稱(chēng),如深度學(xué)習(xí)等。
適用范圍基于預(yù)期用途、使用場(chǎng)景、核心功能予以規(guī)范,如處理對(duì)象、目標(biāo)疾病、醫(yī)療用途、適用人群、目標(biāo)用戶(hù)、使用場(chǎng)所、采集設(shè)備要求、使用限制等。
(2)人工智能軟件組件
人工智能軟件組件通常無(wú)需在注冊(cè)證載明信息中體現(xiàn)。其軟件功能名稱(chēng)可參照人工智能獨(dú)立軟件要求。若有輔助決策類(lèi)軟件功能,結(jié)構(gòu)組成(若適用)和適用范圍需予以體現(xiàn)。
2.算法研究資料
對(duì)于軟件安全性級(jí)別為中等、嚴(yán)重級(jí)別的產(chǎn)品,全新類(lèi)型在軟件研究資料中以算法為單位,提交每個(gè)人工智能算法或算法組合的算法研究報(bào)告,具體要求詳見(jiàn)第六章;成熟類(lèi)型在軟件研究資料中明確算法基本信息即可,無(wú)需提供算法研究資料。
對(duì)于軟件安全性級(jí)別為輕微級(jí)別的產(chǎn)品,在軟件研究資料中明確算法基本信息即可,無(wú)需提供算法研究資料。
3.用戶(hù)培訓(xùn)方案
對(duì)于軟件安全性級(jí)別為嚴(yán)重級(jí)別、預(yù)期由患者使用或在基層醫(yī)療機(jī)構(gòu)使用的產(chǎn)品,原則上需單獨(dú)提供一份用戶(hù)培訓(xùn)方案,包括用戶(hù)培訓(xùn)的計(jì)劃、材料、方式、師資等。
4.產(chǎn)品技術(shù)要求
產(chǎn)品技術(shù)要求若含有基于測(cè)評(píng)數(shù)據(jù)庫(kù)測(cè)試的性能指標(biāo),需在“附錄”中明確測(cè)評(píng)數(shù)據(jù)庫(kù)的基本信息(如名稱(chēng)、型號(hào)規(guī)格、完整版本、責(zé)任方、主文檔登記編號(hào)等)。
基于其他類(lèi)型第三方數(shù)據(jù)庫(kù)測(cè)試的性能指標(biāo),原則上無(wú)需在產(chǎn)品技術(shù)要求中體現(xiàn)。
5.說(shuō)明書(shū)
根據(jù)算法性能綜合評(píng)價(jià)結(jié)果,對(duì)產(chǎn)品的適用范圍、使用場(chǎng)景、核心功能進(jìn)行必要限制,并在說(shuō)明書(shū)中明確產(chǎn)品使用限制和必要警示提示信息。若適用,明確數(shù)據(jù)采集設(shè)備和數(shù)據(jù)采集過(guò)程相關(guān)要求。
對(duì)于輔助決策類(lèi)產(chǎn)品,說(shuō)明書(shū)需明確人工智能算法的算法性能評(píng)估總結(jié)(測(cè)試集基本信息、評(píng)估指標(biāo)與結(jié)果)、臨床評(píng)價(jià)總結(jié)(臨床數(shù)據(jù)基本信息、評(píng)價(jià)指標(biāo)與結(jié)果)、決策指標(biāo)定義(或提供決策指標(biāo)定義所依據(jù)的臨床指南、專(zhuān)家共識(shí)等參考文獻(xiàn))等信息。此時(shí)若采用基于數(shù)據(jù)的人工智能算法,說(shuō)明書(shū)還需補(bǔ)充算法訓(xùn)練總結(jié)信息(訓(xùn)練集基本信息、訓(xùn)練指標(biāo)與結(jié)果)。
若產(chǎn)品采用人工智能黑盒算法,則需根據(jù)算法影響因素分析報(bào)告,在說(shuō)明書(shū)中明確產(chǎn)品使用限制和必要警示提示信息。
(二)變更注冊(cè)
1.算法研究資料
對(duì)于軟件安全性級(jí)別為中等、嚴(yán)重級(jí)別的產(chǎn)品,全新類(lèi)型在軟件研究資料中以算法為單位,根據(jù)人工智能算法的更新情況,提交每個(gè)人工智能算法或算法組合的算法更新研究報(bào)告(或算法研究報(bào)告),具體要求詳見(jiàn)第六章;成熟類(lèi)型在軟件研究資料中明確算法基本信息即可,無(wú)需提供算法研究資料。
對(duì)于軟件安全性級(jí)別為輕微級(jí)別的產(chǎn)品,在軟件研究資料中明確算法基本信息即可,無(wú)需提供算法研究資料。
2.用戶(hù)培訓(xùn)方案
若適用,提交用戶(hù)培訓(xùn)方案變化情況說(shuō)明。
3.產(chǎn)品技術(shù)要求
若適用,產(chǎn)品技術(shù)要求變更對(duì)比表需體現(xiàn)測(cè)評(píng)數(shù)據(jù)庫(kù)的變化情況[測(cè)評(píng)數(shù)據(jù)庫(kù)作為產(chǎn)品評(píng)價(jià)工具,其自身更新原則上無(wú)需申請(qǐng)變更注冊(cè),注冊(cè)申請(qǐng)人可根據(jù)情況自行決定。]。
4.說(shuō)明書(shū)
若適用,提交說(shuō)明書(shū)變化情況說(shuō)明。
(三)延續(xù)注冊(cè)
延續(xù)注冊(cè)通常無(wú)需提交算法相關(guān)研究資料。若適用,根據(jù)注冊(cè)證“備注”所載明的要求提交相應(yīng)算法研究資料。
[1] 全國(guó)人大. 中華人民共和國(guó)個(gè)人信息保護(hù)法[Z],2021.8
[2] 原國(guó)家食品藥品監(jiān)督管理總局.醫(yī)療器械說(shuō)明書(shū)和標(biāo)簽管理規(guī)定(總局令第6號(hào))[Z],2014.7
[3] 國(guó)家市場(chǎng)監(jiān)督管理總局.醫(yī)療器械注冊(cè)與備案管理辦法(總局令第47號(hào))[Z],2021.8
[4] 原國(guó)家食品藥品監(jiān)督管理總局. 醫(yī)療器械生產(chǎn)質(zhì)量管理規(guī)范(2014年第64號(hào)公告)[Z],2014.12
[5] 國(guó)家藥品監(jiān)督管理局.醫(yī)療器械主文檔登記事項(xiàng)(2021年第36號(hào)公告)[Z],2021.3
[6] 國(guó)家市場(chǎng)監(jiān)督管理總局.醫(yī)療器械注冊(cè)申報(bào)資料要求和批準(zhǔn)證明文件格式(2021年第121號(hào)公告)[Z],2021.9
[7] 原國(guó)家食品藥品監(jiān)督管理總局.移動(dòng)醫(yī)療器械注冊(cè)技術(shù)審查指導(dǎo)原則(2017年第222號(hào)通告)[Z],2017.12
[8] 國(guó)家藥品監(jiān)督管理局. 醫(yī)療器械生產(chǎn)質(zhì)量管理規(guī)范附錄獨(dú)立軟件(2019年第43號(hào)通告)[Z],2019.7
[9] 國(guó)家藥品監(jiān)督管理局.醫(yī)療器械安全和性能的基本原則(2020年第18號(hào)通告)[Z],2020.3
[10] 國(guó)家藥品監(jiān)督管理局. 人工智能醫(yī)用軟件產(chǎn)品分類(lèi)界定指導(dǎo)原則(2021年第47號(hào)通告)[Z],2021.7
[11] 國(guó)家藥品監(jiān)督管理局. 醫(yī)用軟件通用名稱(chēng)命名指導(dǎo)原則(2021年第48號(hào)通告)[Z],2021.7
[12] 國(guó)家藥品監(jiān)督管理局.醫(yī)療器械臨床評(píng)價(jià)技術(shù)指導(dǎo)原則(2021年第73號(hào)通告)[Z],2021.9
[13] 國(guó)家藥品監(jiān)督管理局. 醫(yī)療器械生產(chǎn)質(zhì)量管理規(guī)范獨(dú)立軟件現(xiàn)場(chǎng)檢查指導(dǎo)原則(藥監(jiān)綜械管〔2020〕57號(hào))[Z],2020.5
[14] 國(guó)家藥品監(jiān)督管理局醫(yī)療器械技術(shù)審評(píng)中心.醫(yī)療器械軟件技術(shù)審查指導(dǎo)原則(第二版)(征求意見(jiàn)稿)[Z],2020.6
[15] 國(guó)家藥品監(jiān)督管理局醫(yī)療器械技術(shù)審評(píng)中心.醫(yī)療器械網(wǎng)絡(luò)安全技術(shù)審查指導(dǎo)原則(第二版)(征求意見(jiàn)稿)[Z],2020.9
[16] 國(guó)家藥品監(jiān)督管理局醫(yī)療器械技術(shù)審評(píng)中心.醫(yī)療器械人因設(shè)計(jì)技術(shù)審查指導(dǎo)原則(征求意見(jiàn)稿)[Z],2020.5
[17] 國(guó)家藥品監(jiān)督管理局醫(yī)療器械技術(shù)審評(píng)中心.深度學(xué)習(xí)輔助決策醫(yī)療器械軟件審評(píng)要點(diǎn)(2019年第7號(hào)通告)[Z],2019.7
[18] 國(guó)家藥品監(jiān)督管理局醫(yī)療器械技術(shù)審評(píng)中心. 肺炎CT影像輔助分診與評(píng)估軟件審評(píng)要點(diǎn)(試行)(2020年第8號(hào)通告)[Z],2020.3
[19] 國(guó)家衛(wèi)生健康委員會(huì). 人工智能輔助診斷技術(shù)管理規(guī)范(國(guó)衛(wèi)辦醫(yī)發(fā)〔2017〕7號(hào))[Z],2017.2
[20] 國(guó)家衛(wèi)生健康委員會(huì). 人工智能輔助診斷技術(shù)臨床應(yīng)用質(zhì)量控制指標(biāo)(國(guó)衛(wèi)辦醫(yī)發(fā)〔2017〕7號(hào))[Z],2017.2
[21] 國(guó)家衛(wèi)生健康委員會(huì). 人工智能輔助治療技術(shù)管理規(guī)范(國(guó)衛(wèi)辦醫(yī)發(fā)〔2017〕7號(hào))[Z],2017.2
[22] 國(guó)家衛(wèi)生健康委員會(huì). 人工智能輔助治療技術(shù)臨床應(yīng)用質(zhì)量控制指標(biāo)(國(guó)衛(wèi)辦醫(yī)發(fā)〔2017〕7號(hào))[Z],2017.2
[23] GB/T 25000.12-2017 系統(tǒng)與軟件工程 系統(tǒng)與軟件質(zhì)量要求和評(píng)價(jià)(SQuaRE)第12部分:數(shù)據(jù)質(zhì)量模型[S]
[24] YY/T 0287-2017 醫(yī)療器械 質(zhì)量管理體系 用于法規(guī)的要求[S]
[25] YY/T 0316-2016 醫(yī)療器械 風(fēng)險(xiǎn)管理對(duì)醫(yī)療器械的應(yīng)用[S]
[26] YY/T 0664-2020 醫(yī)療器械軟件 軟件生存周期過(guò)程[S]
[27] YY/T 1406.1-2016 醫(yī)療器械軟件 第1部分:YY/T 0316應(yīng)用于醫(yī)療器械軟件的指南[S]
[28] YY/T 人工智能醫(yī)療器械質(zhì)量要求和評(píng)價(jià) 第1部分:術(shù)語(yǔ)(報(bào)批稿)[S],2020.12
[29] YY/T 人工智能醫(yī)療器械質(zhì)量要求和評(píng)價(jià) 第2部分:數(shù)據(jù)集通用要求(報(bào)批稿)[S],2020.12
[30] YY/T 人工智能醫(yī)療器械質(zhì)量要求和評(píng)價(jià) 第3部分:數(shù)據(jù)標(biāo)注通用要求(報(bào)批稿)[S],2021.12
[31] YY/T 人工智能醫(yī)療器械 肺部影像輔助分析軟件 算法性能測(cè)試方法(報(bào)批稿)[S],2021.12
[32] AIMDICP-WG6-2020-001 基于眼底彩照的糖尿病視網(wǎng)膜病變輔助決策產(chǎn)品性能指標(biāo)和測(cè)試方法[S],2020.7
[33] AIMDICP-WG6-2020-002 基于胸部CT的肺結(jié)節(jié)影像輔助決策產(chǎn)品性能指標(biāo)和測(cè)試方法[S],2020.7
[34] IMDRF/AIMD WG/N67, Machine Learning-enabled Medical Devices - A subset of Artificial Intelligence-enabled Medical Devices: Key Terms and Definitions[Z], 2021.9
[35] FDA. Computer-Assisted Detection Devices Applied to Radiology Images and Radiology Device Data[Z], 2012.7
[36] FDA. Considerations for Computer-Assisted Detection Devices Applied to Radiology Images and Radiology Device Data[Z], 2012.7
[37] FDA, Developing a Software Precertification Program: A Working Model[Z], 2019.1
[38] FDA. Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning(AI/ML) - Based Software as a Medical Device(SaMD) (Draft Guidance)[Z], 2019.4
[39] FDA, Clinical Decision Support Software (Draft Guidance)[Z], 2019.9
[40] FDA. Artificial Intelligence and Machine Learning(AI/ ML) Software as a Medical Device(SaMD) Action Plan[Z], 2021.1
[41] FDA/Health Canada/MHRA. Good Machine Learning Practice for Medical Device Development: Guiding Principles[Z], 2021.10
[42] FDA. Technical Considerations for Medical Devices with Physiologic Closed-Loop Control Technology(Draft Guidance)[Z], 2021.12
[43] AAMI/BSI. Artificial Intelligence and Machine Learning - the Emergence of Artificial Intelligence and Machine Learning Algorithmsin Healthcare: Recommendations to Support Governance and Regulation[Z], 2019
[44] AAMI/BSI. Machine Learning AI in Medical Devices: Adapting Regulatory Frameworks and Standards to Ensure Safety andPerformance[Z], 2020
[45] BSI. Recent Advancements in AI - Implications for Medical Device Technology and Certification[Z], 2020
[46] ISO/IEC TR 5469(WD) Artificial intelligence-Functional safety and AI systems[S]
[47] ISO/IEC TR 24028:2020Information technology - Artificial intelligence - Overview of trustworthiness in artificial intelligence[S]
[48] ISO/IEC TR 24029-1:2021 Artificial Intelligence(AI) - Assessment of the robustness of neural networks - Part 1: Overview[S]
[49] ISO/IEC TR 24030:2021 Information technology - Artificial intelligence(AI) - Use cases[S]
[50] ISO/IEC TR 29119-11:2020 Software and systems engineering - Software testing - Part 11: Guidelines on the testing of AI-based systems[S]
[51] 人工智能醫(yī)療器械創(chuàng)新合作平臺(tái)[Z]. https://www.aimd.org.cn
[52]IMDRF AIMD WG[Z]. https://www.imdrf.org/workitems/ wi-aimd.asp
[53] ITU/WHO FG-AI4H [Z]. https://www.itu.int/go/fgai4h
[54] IEEE AIMD WG[Z]. https://sagroups.ieee.org/aimdwg
編輯:Cikey TAG:/人工智能醫(yī)療器械注冊(cè)/指導(dǎo)原則/AI醫(yī)療器械注冊(cè)/醫(yī)療器械軟件注冊(cè)