背景技術:
1、例如經過訓練的神經網絡等人工智能(artificial?intelligence,ai)處理器可用于處理動物的放射學圖像,以確定所成像的動物具有某些健康狀況的概率。通常,單獨的ai處理器被用于評估各個身體區(qū)域(例如,胸部、腹部、肩部、前肢、后肢等)和/或每個這樣的身體區(qū)域的特定定向(例如,腹背(ventral?dorsal,vd)視圖、側視圖等)。特定的ai處理器針對于各個身體區(qū)域和/或定向確定特定健康狀況存在于所討論的身體區(qū)域的概率。每個這樣的ai處理器都包括大量經過訓練的模型,以評估成像區(qū)域內相應的健康狀況或器官。例如,對于動物胸部的側視圖,ai處理器采用不同的模型來確定動物具有與肺部相關的某些健康狀況(諸如肺門周圍浸潤、肺炎、支氣管炎、肺結節(jié)等)的概率。
2、每個這樣的ai處理器執(zhí)行的處理量以及完成這種處理所需的時間量是巨大的。該任務需要以下二者之一:(1)在特定ai處理器評估圖像之前,手動識別和裁剪每個圖像,以定義特定的身體區(qū)域和定向,或者(2)將圖像饋送到每個ai處理器進行評估。與放射學研究僅限于特定區(qū)域的人類放射學不同,獸醫(yī)放射學通常在一項研究中包括多個未標記的圖像,且這些圖像涉及多個定向未知的身體區(qū)域。
3、在處理動物放射學圖像的傳統(tǒng)工作流程中,系統(tǒng)假設圖像中包含用戶識別的身體區(qū)域。然后,用戶識別的圖像被發(fā)送到特定的ai處理器,例如,這些處理器使用機器學習(machine?learning,ml)模型來評估特定身體區(qū)域存在醫(yī)療狀況的概率。然而,如果識別的身體區(qū)域不正確或圖像中包含多個區(qū)域,則要求用戶識別身體區(qū)域會在傳統(tǒng)工作流程中產生摩擦并導致錯誤。此外,當沒有身體區(qū)域用戶標識的圖像被發(fā)送到系統(tǒng)時,傳統(tǒng)的工作流程變得低效(或崩潰)。當這種情況發(fā)生時,傳統(tǒng)的工作流程效率低下,因為未識別的圖像被發(fā)送到大量不特定于成像身體區(qū)域的ai處理器。此外,傳統(tǒng)的工作流程容易產生錯誤的結果,因為不正確的區(qū)域識別會導致圖像被發(fā)送到配置為評估不同身體區(qū)域的ai處理器。
4、使用ai分析射線照片的診斷特征并基于ai模型診斷準備報告的傳統(tǒng)工作流程會產生指數級數量的可能的輸出報告。ai模型診斷結果提供了關于特定健康狀況的正?;虍惓4_定。在一些ai模型中,還提供了對特定健康狀況嚴重性的確定,例如正常、輕微、輕度、中度或重度。ai模型診斷結果的集合決定了從預制報告模板中選定哪個報告。從ai模型診斷結果的集合中創(chuàng)建和選擇單個報告模板的過程隨著ai模型的數量呈指數級改變規(guī)模。六個不同的ai模型正常/異常診斷結果需要64個不同的報告模板(2提高到六次冪)。10個模型需要1024個模板,16個模型需要65536個模板。檢測嚴重性的ai模型規(guī)模改變甚至更糟糕,例如16個嚴重性檢測模型,每個模型有5個可能的嚴重性,需要超過1500億個模板。因此,為ai模型診斷結果的每種組合手動創(chuàng)建的報告不能很好地擴展為同時解釋大量的ai模型。
5、因此,需要一種新穎的系統(tǒng),該系統(tǒng)具有若干完全自動化的圖像預處理和圖像分析階段,包括確定接收到的圖像是否包括特定定向(側視圖等)的特定身體區(qū)域;適當地裁剪圖像;從包含多于一個身體區(qū)域或感興趣區(qū)域的原始圖像創(chuàng)建一個或更多個子圖像;標記原始圖像和創(chuàng)建的任何子圖像;以及根據目標ai模型評估裁剪后的圖像和子圖像。此外,需要一種新穎的系統(tǒng),該系統(tǒng)基于大量測試結果(包括但不限于ai模型結果)分析并提供放射診斷醫(yī)師報告。
6、機器學習中的ai模型或分類器經過持續(xù)訓練來提高模型性能。ai模型部署的最佳實踐涉及持續(xù)訓練,持續(xù)訓練包括對當前部署的ai模型進行再訓練。再訓練是基于這些常見參數中的一個或更多個,如基于ai性能、基于數據變化的觸發(fā)器或按需求訓練。當前ai模型再訓練的行業(yè)標準的目標是用新的、“改進的”ai模型替換當前訓練的模型。當前的ai技術基于生產環(huán)境中的單一模型結果,因此發(fā)展了再訓練和替換的概念。
7、當前方法的問題是,用新訓練的ai模型替換當前ai模型是根據如下假設工作的,即模型性能的提高在于減少不想要的“噪聲”或假陽性數據。在當前ai模型中檢測為不想要的“噪聲”的數據被刪除,并替換為再訓練的ai模型。然而,假設“噪聲”在整體系統(tǒng)性能中不是有價值的信息是不正確的。當前模型分類器檢測到的“噪聲”有助于區(qū)分具有相似但不完全相同特征的數據點。因此,通過替換當前ai模型,數據會丟失。
8、因此,需要一種結合了新ai模型和舊ai模型二者的新的方法來持續(xù)訓練ai模型。
技術實現思路
1、本文所述的發(fā)明的一個方面提供了一種從數字文件中獲得加性ai結果的方法,該方法包括:通過第一人工智能(ai)分類器和至少一個第二ai分類器處理數字文件,從而分別獲得第一評估結果和至少一個第二評估結果;將第一評估結果和至少一個第二評估結果引導到至少一個合成處理器;以及將第一評估結果和至少一個第二評估結果與至少一個數據集聚類進行比較,從而獲得加性ai結果。術語ai模型和ai分類器可以互換使用,并且其被定義為一種用于為數據輸入分配類標記的機器學習算法。
2、該方法的實施例還包括測量從加性ai結果到來自數據集聚類的示例結果的距離,以獲得加性ai聚類標識。在該方法的實施例中,數據集聚類還包括匹配的書面模板。該方法的實施例還包括匯編加性ai聚類標識和匹配的書面模板以獲得報告。該方法的實施例還包括向用戶顯示報告。
3、在該方法的實施例中,第二ai分類器是第一ai分類器的派生。在該方法的實施例中,使用用于訓練第一ai分類器的數據的至少一部分來訓練第二ai分類器。例如,使用用于訓練第一ai分類器的數據的至少99%、95%、90%、85%、80%、75%、70%、66%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%來訓練第二分類器。在該方法的實施例中,第二ai分類器與第一ai分類器相關。在一些實施例中,第一ai分類器是綜合分類器。在一些實施例中,第二ai分類器是特定的分類器。在替代實施例中,第一ai分類器是特定分類器,而第二ai分類器是綜合分類器。
4、該方法的實施例還包括對一系列菊花鏈接的ai分類器重復引導和比較的步驟。該方法的實施例還包括將第一評估結果與第二評估結果進行比較,以用于訓練第一和第二ai分類器,或者以用于比較ai結果并測試預期性能。
5、該方法的實施例還包括將第一評估結果和第二評估結果添加到結果數據庫中。該方法的實施例還包括在處理之前獲取數字文件。該方法的實施例還包括在處理之前將模擬文件轉換為數字文件。該方法的實施例還包括在處理之前,通過對數字文件執(zhí)行標記、裁剪、編輯和定向中的至少一個來對數字文件進行分類。
6、該方法的實施例還包括通過將數學公式應用于ai模型結果以啟發(fā)式方式調整ai模型結果,該數學公式包括加、減、乘、除或任何其他標準數學公式中的至少一個。
7、本文所述本發(fā)明的一個方面提供了一種系統(tǒng),該系統(tǒng)被編程為通過本文所述的任何方法獲得加性ai結果,該系統(tǒng)包括:至少一個第一ai處理器;派生自第一ai處理器的至少一個派生ai處理器;以及輸出設備。
8、該系統(tǒng)的實施例還包括至少一個數據庫。該系統(tǒng)的實施例還包括用戶界面。在一些實施例中,ai結果僅來自一個第一ai分類器的一個派生分類器。在一些實施例中,結果中僅包括一個第一ai分類器的多于一個的派生分類器。在一些實施例中,結果中包括多于一個第一ai分類器的一個派生分類器。在一些實施例中,結果中包括多于一個第一ai分類器的多于一個派生分類器。在一些實施例中,結果中包括僅用于第一ai分類器中的一些的一個派生分類器和用于第一ai分類器中的一些的多于一個派生分類器。