本技術(shù)涉及空調(diào),具體涉及一種空調(diào)語音助手訓練方法、裝置、存儲介質(zhì)及服務(wù)器。
背景技術(shù):
1、智能語音系統(tǒng)的應用已經(jīng)在多個領(lǐng)域廣泛普及,涵蓋日常生活、智能家居、商業(yè)服務(wù)、醫(yī)療和汽車等行業(yè)??照{(diào)語音助手用于空調(diào)與用戶進行語音交互及控制空調(diào),具有重要意義。
2、空調(diào)語音助手為采用空調(diào)語音助手訓練數(shù)據(jù)對模型進行訓練得到的訓練后模型,而目前訓練作為空調(diào)語音助手的時候,通常按照常規(guī)訓練其它設(shè)備(如電視或車輛等)的語音助手的方式,通常采用復雜協(xié)議格式的空調(diào)語音助手訓練數(shù)據(jù)對模型進行訓練。以這種方式訓練模型,由于采用復雜協(xié)議格式的訓練數(shù)據(jù),反而使得訓練得到的空調(diào)語音助手容易理解錯誤空調(diào)場景中的用戶語音所表達的意圖,而且訓練模型時耗費資源高且效率較低。
3、因此,目前的空調(diào)語音助手訓練方式,存在空調(diào)語音助手的意圖理解準確性較差,耗費資源且效率較低的問題,空調(diào)場景中用戶交互體驗較差。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例提供一種方案,可以有效提升空調(diào)語音助手對空調(diào)場景中的用戶語音所表達的意圖的理解準確性,降低訓練模型時耗費資源且提升效率,提升空調(diào)場景中用戶交互體驗。
2、本技術(shù)實施例提供以下技術(shù)方案:
3、根據(jù)本技術(shù)的一個實施例,一種空調(diào)語音助手訓練方法,其包括:獲取空調(diào)語音助手訓練數(shù)據(jù),所述空調(diào)語音助手訓練數(shù)據(jù)中包括初始協(xié)議格式的多個初始樣本數(shù)據(jù);對所述空調(diào)語音助手訓練數(shù)據(jù)中包括的初始樣本數(shù)據(jù)進行協(xié)議格式調(diào)整,得到簡化協(xié)議格式的多個新樣本數(shù)據(jù);采用所述簡化協(xié)議格式的多個新樣本數(shù)據(jù)對待訓練基座模型進行訓練,得到空調(diào)語音助手模型,所述空調(diào)語音助手模型用于作為空調(diào)語音助手。
4、在本技術(shù)的一些實施例中,所述對所述空調(diào)語音助手訓練數(shù)據(jù)中包括的初始樣本數(shù)據(jù)進行協(xié)議格式調(diào)整,得到簡化協(xié)議格式的多個新樣本數(shù)據(jù),包括:確定各所述初始樣本數(shù)據(jù)對應的任務(wù)類型所對應簡化協(xié)議格式,其中,任務(wù)類型對應的任務(wù)復雜度越低則任務(wù)類型所對應簡化協(xié)議格式的簡化程度越低;按照各所述初始樣本數(shù)據(jù)對應的任務(wù)類型所對應簡化協(xié)議格式,對各所述初始樣本數(shù)據(jù)分別進行格式調(diào)整處理,得到所述多個新樣本數(shù)據(jù)。
5、在本技術(shù)的一些實施例中,所述按照各所述初始樣本數(shù)據(jù)對應的任務(wù)類型所對應簡化協(xié)議格式,對各所述初始樣本數(shù)據(jù)分別進行格式調(diào)整處理,得到所述多個新樣本數(shù)據(jù),包括:根據(jù)各所述初始樣本數(shù)據(jù)對應的任務(wù)類型,對各所述初始樣本數(shù)據(jù)進行冗余信息自適應壓縮處理,得到多個信息簡化數(shù)據(jù);將所述多個信息簡化數(shù)據(jù)分別按照對應的簡化協(xié)議格式進行協(xié)議格式調(diào)整,得到所述多個新樣本數(shù)據(jù)。
6、在本技術(shù)的一些實施例中,所述將所述多個信息簡化數(shù)據(jù)分別按照對應的簡化協(xié)議格式進行協(xié)議格式調(diào)整,得到所述多個新樣本數(shù)據(jù),包括:將所述多個信息簡化數(shù)據(jù)分別進行隱私保護處理,得到多個安全簡化數(shù)據(jù);將所述多個安全簡化數(shù)據(jù)分別按照對應的簡化協(xié)議格式進行協(xié)議格式調(diào)整,得到所述多個新樣本數(shù)據(jù)。
7、在本技術(shù)的一些實施例中,所述采用所述簡化協(xié)議格式的多個新樣本數(shù)據(jù)對待訓練基座模型進行訓練,得到空調(diào)語音助手模型,包括:對所述多個新樣本數(shù)據(jù)分別增加多模態(tài)信息,得到多個多模態(tài)樣本數(shù)據(jù);采用所述多個多模態(tài)樣本數(shù)據(jù)對所述待訓練基座模型進行訓練,得到所述空調(diào)語音助手模型。
8、在本技術(shù)的一些實施例中,所述采用所述簡化協(xié)議格式的多個新樣本數(shù)據(jù)對待訓練基座模型進行訓練,得到空調(diào)語音助手模型,包括:將所述簡化協(xié)議格式的多個新樣本數(shù)據(jù)輸入所述待訓練基座模型;基于所述待訓練基座模型進行混合意圖識別訓練,直至符合預定結(jié)束訓練條件,得到所述空調(diào)語音助手模型。
9、在本技術(shù)的一些實施例中,所述采用所述簡化協(xié)議格式的多個新樣本數(shù)據(jù)對待訓練基座模型進行訓練,得到空調(diào)語音助手模型,包括:對所述待訓練基座模型加入無監(jiān)督學習部分;采用所述簡化協(xié)議格式的多個新樣本數(shù)據(jù)對加入了所述無監(jiān)督學習部分的待訓練基座模型進行無監(jiān)督學習優(yōu)化訓練,得到所述空調(diào)語音助手模型。
10、根據(jù)本技術(shù)的一個實施例,一種空調(diào)語音助手訓練裝置,所述裝置包括:獲取模塊,用于:獲取空調(diào)語音助手訓練數(shù)據(jù),所述空調(diào)語音助手訓練數(shù)據(jù)中包括初始協(xié)議格式的多個初始樣本數(shù)據(jù);調(diào)整模塊,用于:對所述空調(diào)語音助手訓練數(shù)據(jù)中包括的初始樣本數(shù)據(jù)進行協(xié)議格式調(diào)整,得到簡化協(xié)議格式的多個新樣本數(shù)據(jù);訓練模塊,用于:采用所述簡化協(xié)議格式的多個新樣本數(shù)據(jù)對待訓練基座模型進行訓練,得到空調(diào)語音助手模型,所述空調(diào)語音助手模型用于作為空調(diào)語音助手。
11、在本技術(shù)的一些實施例中,所述調(diào)整模塊,用于:確定各所述初始樣本數(shù)據(jù)對應的任務(wù)類型所對應簡化協(xié)議格式,其中,任務(wù)類型對應的任務(wù)復雜度越低則任務(wù)類型所對應簡化協(xié)議格式的簡化程度越低;按照各所述初始樣本數(shù)據(jù)對應的任務(wù)類型所對應簡化協(xié)議格式,對各所述初始樣本數(shù)據(jù)分別進行格式調(diào)整處理,得到所述多個新樣本數(shù)據(jù)。
12、在本技術(shù)的一些實施例中,所述調(diào)整模塊,用于:根據(jù)各所述初始樣本數(shù)據(jù)對應的任務(wù)類型,對各所述初始樣本數(shù)據(jù)進行冗余信息自適應壓縮處理,得到多個信息簡化數(shù)據(jù);將所述多個信息簡化數(shù)據(jù)分別按照對應的簡化協(xié)議格式進行協(xié)議格式調(diào)整,得到所述多個新樣本數(shù)據(jù)。
13、在本技術(shù)的一些實施例中,所述調(diào)整模塊,用于:將所述多個信息簡化數(shù)據(jù)分別進行隱私保護處理,得到多個安全簡化數(shù)據(jù);將所述多個安全簡化數(shù)據(jù)分別按照對應的簡化協(xié)議格式進行協(xié)議格式調(diào)整,得到所述多個新樣本數(shù)據(jù)。
14、在本技術(shù)的一些實施例中,所述訓練模塊,用于:對所述多個新樣本數(shù)據(jù)分別增加多模態(tài)信息,得到多個多模態(tài)樣本數(shù)據(jù);采用所述多個多模態(tài)樣本數(shù)據(jù)對所述待訓練基座模型進行訓練,得到所述空調(diào)語音助手模型。
15、在本技術(shù)的一些實施例中,所述訓練模塊,用于:將所述簡化協(xié)議格式的多個新樣本數(shù)據(jù)輸入所述待訓練基座模型;基于所述待訓練基座模型進行混合意圖識別訓練,直至符合預定結(jié)束訓練條件,得到所述空調(diào)語音助手模型。
16、在本技術(shù)的一些實施例中,所述訓練模塊,用于:對所述待訓練基座模型加入無監(jiān)督學習部分;采用所述簡化協(xié)議格式的多個新樣本數(shù)據(jù)對加入了所述無監(jiān)督學習部分的待訓練基座模型進行無監(jiān)督學習優(yōu)化訓練,得到所述空調(diào)語音助手模型。
17、根據(jù)本技術(shù)的另一實施例,一種存儲介質(zhì),其上存儲有計算機程序,當所述計算機程序被服務(wù)器的處理器執(zhí)行時,使服務(wù)器執(zhí)行本技術(shù)實施例所述的方法。
18、根據(jù)本技術(shù)的另一實施例,一種服務(wù)器可以包括:存儲器,存儲有計算機程序;處理器,讀取存儲器存儲的計算機程序,以執(zhí)行本技術(shù)實施例所述的方法。
19、根據(jù)本技術(shù)的另一實施例,一種計算機程序產(chǎn)品或計算機程序,該計算機程序產(chǎn)品或計算機程序包括計算機指令,該計算機指令存儲在計算機可讀存儲介質(zhì)中。服務(wù)器的處理器從計算機可讀存儲介質(zhì)讀取該計算機指令,處理器執(zhí)行該計算機指令,使得該服務(wù)器執(zhí)行本技術(shù)實施例所述的各種可選實現(xiàn)方式中提供的方法。
20、本技術(shù)實施例中,獲取空調(diào)語音助手訓練數(shù)據(jù),所述空調(diào)語音助手訓練數(shù)據(jù)中包括初始協(xié)議格式的多個初始樣本數(shù)據(jù);對所述空調(diào)語音助手訓練數(shù)據(jù)中包括的初始樣本數(shù)據(jù)進行協(xié)議格式調(diào)整,得到簡化協(xié)議格式的多個新樣本數(shù)據(jù);采用所述簡化協(xié)議格式的多個新樣本數(shù)據(jù)對待訓練基座模型進行訓練,得到空調(diào)語音助手模型,所述空調(diào)語音助手模型用于作為空調(diào)語音助手。
21、以本技術(shù)實施例的這種方式,通過對空調(diào)語音助手訓練數(shù)據(jù)中包括的訓練樣本進行協(xié)議格式調(diào)整得到簡化協(xié)議格式的多個新樣本數(shù)據(jù),采用簡化協(xié)議格式的多個新樣本數(shù)據(jù)對待訓練基座模型進行訓練,訓練得到的空調(diào)語音助手模型作為空調(diào)語音助手,可以有效提升空調(diào)語音助手對空調(diào)場景中的用戶語音所表達的意圖的理解準確性,降低訓練模型時耗費資源且提升效率,提升空調(diào)場景中用戶交互體驗。