本發(fā)明屬于智能座艙語音控制領(lǐng)域,具體涉及一種本地模型和大模型相融合的智能座艙語言控制方法。
背景技術(shù):
1、隨著汽車智能化的快速發(fā)展,智能座艙成為提升駕駛體驗的關(guān)鍵部分。其中,語音控制功能作為一種便捷的交互方式,受到越來越多消費者的青睞。
2、然而,傳統(tǒng)的智能座艙語音控制主要存在以下幾種技術(shù)方案及相應(yīng)問題:
3、僅使用本地模型時,由于其數(shù)據(jù)量和計算資源的限制,模型的學習能力有限,導致語音識別的準確率和泛化能力難以提升,不能很好地適應(yīng)各種復(fù)雜的語音場景和新的用戶表達方式;
4、僅使用云端大模型時,雖然有強大的學習和處理能力,但在實時性方面存在不足,例如網(wǎng)絡(luò)連接不穩(wěn)定或中斷時,語音控制功能可能受到嚴重影響,并且大量數(shù)據(jù)的傳輸也可能存在隱私和安全問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種本地模型和大模型相融合的智能座艙語言控制方法,以解決上述背景技術(shù)中提出的單一模型難以滿足實際使用需求的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種本地模型和大模型相融合的智能座艙語言控制方法,包括:
4、s1、獲取語音信息并初步分析內(nèi)容復(fù)雜度,得到分析結(jié)果;
5、s2、當所述分析結(jié)果表示復(fù)雜后對當前網(wǎng)絡(luò)環(huán)境進行判斷,得到判斷結(jié)果;
6、s3、當所述分析結(jié)果表示簡單或所述判斷結(jié)果表示網(wǎng)絡(luò)環(huán)境差時,將所述語音信息輸出至本地小模型進行識別工作,得到本地識別數(shù)據(jù),并將所述本地識別數(shù)據(jù)輸出至云端大模型;
7、s4、當所述判斷結(jié)果表示網(wǎng)絡(luò)環(huán)境好或所述本地小模型無法識別所述語音信息時,將所述語音信息輸出至所述云端大模型進行識別工作,得到云端識別數(shù)據(jù),并根據(jù)所述云端識別數(shù)據(jù)更新所述本地小模型;
8、s5、根據(jù)所述本地識別數(shù)據(jù)或所述云端識別數(shù)據(jù)得到指令,并將所述指令輸出至智能座艙。
9、優(yōu)選的,所述本地小模型承擔基礎(chǔ)的語音指令處理功能,包括采用基于決策樹或支持向量機的簡單分類算法對常見語音指令的快速識別與初步處理。
10、優(yōu)選的,所述本地小模型與所述云端大模型之間建立安全可靠的數(shù)據(jù)傳輸通道實時通信連接,用于接收所述云端大模型輸送的模型更新數(shù)據(jù),并根據(jù)所述模型更新數(shù)據(jù)進行自我更新,所述模型更新數(shù)據(jù)包括升級后的部分模型參數(shù)或算法,用于在不影響所述本地小模型正常運行的情況下逐步提升其性能,采用ssl/tls協(xié)議。
11、優(yōu)選的,所述本地小模型對所述語音信息進行篩選與整理,提取其中具有共性的語音特征信息,定期上傳至所述云端大模型。
12、優(yōu)選的,所述云端大模型使用卷積神經(jīng)網(wǎng)絡(luò)或長短時記憶網(wǎng)絡(luò)構(gòu)建;
13、基于從多個所述本地小模型收集到的大量反饋數(shù)據(jù)與廣泛語音數(shù)據(jù)進行持續(xù)學習和訓練,所述廣泛語音數(shù)據(jù)包括不同語言、口音和場景下的語音數(shù)據(jù);
14、所述云端大模型根據(jù)所述持續(xù)學習和訓練的結(jié)果進行自我升級;
15、利用先進的機器學習算法和大規(guī)模計算資源,不斷優(yōu)化模型的參數(shù)和結(jié)構(gòu),以提高對各種語音模式的識別能力。
16、優(yōu)選的,所述本地小模型還用于記錄每次語音指令的識別情況和相關(guān)參數(shù),采用哈希表在本地儲存一定量的語音樣板數(shù)據(jù)和識別結(jié)果數(shù)據(jù)。
17、優(yōu)選的,所述云端大模型還用于設(shè)置嚴格的數(shù)據(jù)訪問控制策略,只有授權(quán)的所述本地小模型可以上傳和下載數(shù)據(jù)。
18、優(yōu)選的,所述將所述本地識別數(shù)據(jù)輸出至云端大模型和根據(jù)所述云端識別數(shù)據(jù)更新所述本地小模型用于所述本地小模型和所述云端大模型數(shù)據(jù)共享,根據(jù)所述數(shù)據(jù)共享采用基于梯度下降的聯(lián)合優(yōu)化算法同時調(diào)整所述本地通用小模型和所述云端大模型的參數(shù);
19、根據(jù)不同的使用場景和語音指令類型,動態(tài)調(diào)整優(yōu)化所述基于梯度下降的聯(lián)合優(yōu)化算法的參數(shù)和權(quán)重。
20、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
21、本發(fā)明通過融合本地小模型與云端大模型,充分發(fā)揮本地小模型和云端大模型各自的優(yōu)勢,兩者協(xié)同作業(yè)提高語音控制的識別率,本地小模型在本地快速處理語音指令,減少了對網(wǎng)絡(luò)連接的依賴,保證了語音控制功能在網(wǎng)絡(luò)不穩(wěn)定情況下的基本可用性,同時減少了大量敏感語音數(shù)據(jù)向云端傳輸?shù)男枨?,降低了隱私泄露的風險。
1.一種本地模型和大模型相融合的智能座艙語言控制方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種本地模型和大模型相融合的智能座艙語言控制方法,其特征在于,所述本地小模型承擔基礎(chǔ)的語音指令處理功能,包括采用基于決策樹或支持向量機的簡單分類算法對常見語音指令的快速識別與初步處理。
3.根據(jù)權(quán)利要求1所述的一種本地模型和大模型相融合的智能座艙語言控制方法,其特征在于,所述本地小模型與所述云端大模型之間建立安全可靠的數(shù)據(jù)傳輸通道實時通信連接,用于接收所述云端大模型輸送的模型更新數(shù)據(jù),并根據(jù)所述模型更新數(shù)據(jù)進行自我更新,所述模型更新數(shù)據(jù)包括升級后的部分模型參數(shù)或算法,用于在不影響所述本地小模型正常運行的情況下逐步提升其性能,采用ssl/tls協(xié)議。
4.根據(jù)權(quán)利要求1所述的一種本地模型和大模型相融合的智能座艙語言控制方法,其特征在于,所述本地小模型對所述語音信息進行篩選與整理,提取其中具有共性的語音特征信息,定期上傳至所述云端大模型。
5.根據(jù)權(quán)利要求1所述的一種本地模型和大模型相融合的智能座艙語言控制方法,其特征在于,所述云端大模型使用卷積神經(jīng)網(wǎng)絡(luò)或長短時記憶網(wǎng)絡(luò)構(gòu)建;
6.根據(jù)權(quán)利要求1所述的一種本地模型和大模型相融合的智能座艙語言控制方法,其特征在于,所述本地小模型還用于記錄每次語音指令的識別情況和相關(guān)參數(shù),采用哈希表在本地儲存一定量的語音樣板數(shù)據(jù)和識別結(jié)果數(shù)據(jù)。
7.根據(jù)權(quán)利要求1所述的一種本地模型和大模型相融合的智能座艙語言控制方法,其特征在于,所述云端大模型還用于設(shè)置嚴格的數(shù)據(jù)訪問控制策略,只有授權(quán)的所述本地小模型可以上傳和下載數(shù)據(jù)。
8.根據(jù)權(quán)利要求1所述的一種本地模型和大模型相融合的智能座艙語言控制方法,其特征在于,所述將所述本地識別數(shù)據(jù)輸出至云端大模型和根據(jù)所述云端識別數(shù)據(jù)更新所述本地小模型用于所述本地小模型和所述云端大模型數(shù)據(jù)共享,根據(jù)所述數(shù)據(jù)共享采用基于梯度下降的聯(lián)合優(yōu)化算法同時調(diào)整所述本地通用小模型和所述云端大模型的參數(shù);