日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種語音識別方法、裝置、設(shè)備及可讀存儲介質(zhì)與流程

文檔序號:42041063發(fā)布日期:2025-05-30 17:39閱讀:16來源:國知局

本發(fā)明涉及語音識別,具體而言,涉及一種語音識別方法、裝置、設(shè)備及可讀存儲介質(zhì)。


背景技術(shù):

1、現(xiàn)有技術(shù)中噪聲是影響語音識別系統(tǒng)準確性和魯棒性的關(guān)鍵因素,許多語音識別模型在處理攜帶噪聲的音頻數(shù)據(jù)時表現(xiàn)不佳,導致識別錯誤率增加,特別是在嘈雜環(huán)境下,語音信號中的噪聲干擾可能掩蓋語音信息,影響特征提取和模型性能,因此亟需一種有效的方法來處理攜帶噪聲的語音數(shù)據(jù),以提升語音識別系統(tǒng)的準確性和魯棒性。


技術(shù)實現(xiàn)思路

1、本發(fā)明的目的在于提供一種語音識別方法、裝置、設(shè)備及可讀存儲介質(zhì),以改善上述問題。為了實現(xiàn)上述目的,本發(fā)明采取的技術(shù)方案如下:

2、第一方面,本申請?zhí)峁┝艘环N語音識別方法,包括:

3、獲取歷史音頻數(shù)據(jù),所述歷史音頻數(shù)據(jù)包括攜帶有噪聲的歷史語音數(shù)據(jù)和未攜帶噪聲的歷史語音數(shù)據(jù);

4、將攜帶有噪聲的歷史語音數(shù)據(jù)輸入預(yù)設(shè)的處理模型中進行預(yù)處理,得到處理后的語音數(shù)據(jù);

5、對處理后的語音數(shù)據(jù)和未攜帶噪聲的歷史語音數(shù)據(jù)進行特征提取,分別得到第一語音特征和第二語音特征;

6、計算所述第一語音特征和所述第二語音特征的相似度,當相似度大于第一設(shè)定閾值時,將預(yù)設(shè)的目標音頻數(shù)據(jù)輸入所述預(yù)處理模型中進行預(yù)處理,得到目標語音數(shù)據(jù),所述目標音頻數(shù)據(jù)為待識別的音頻數(shù)據(jù);

7、將所述目標語音數(shù)據(jù)輸入預(yù)設(shè)的語音識別模型進行語音識別,得到語音識別結(jié)果。

8、第二方面,本申請還提供了一種語音識別裝置,包括:

9、第一獲取單元,用于獲取歷史音頻數(shù)據(jù),所述歷史音頻數(shù)據(jù)包括攜帶有噪聲的歷史語音數(shù)據(jù)和未攜帶噪聲的歷史語音數(shù)據(jù);

10、第一輸入單元,用于將攜帶有噪聲的歷史語音數(shù)據(jù)輸入預(yù)設(shè)的處理模型中進行預(yù)處理,得到處理后的語音數(shù)據(jù);

11、提取單元,用于對處理后的語音數(shù)據(jù)和未攜帶噪聲的歷史語音數(shù)據(jù)進行特征提取,分別得到第一語音特征和第二語音特征;

12、第一計算單元,用于計算所述第一語音特征和所述第二語音特征的相似度,當相似度大于第一設(shè)定閾值時,將預(yù)設(shè)的目標音頻數(shù)據(jù)輸入所述預(yù)處理模型中進行預(yù)處理,得到目標語音數(shù)據(jù),所述目標音頻數(shù)據(jù)為待識別的音頻數(shù)據(jù);

13、第二輸入單元,用于將所述目標語音數(shù)據(jù)輸入預(yù)設(shè)的語音識別模型進行語音識別,得到語音識別結(jié)果。

14、第三方面,本申請還提供了一種語音識別設(shè)備,包括:

15、存儲器,用于存儲計算機程序;

16、處理器,用于執(zhí)行所述計算機程序時實現(xiàn)所述語音識別方法的步驟。

17、第四方面,本申請還提供了一種可讀存儲介質(zhì),所述可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述語音識別方法的步驟。

18、本發(fā)明的有益效果為:

19、本發(fā)明通過將攜帶噪聲的歷史語音數(shù)據(jù)輸入模型進行預(yù)處理,并將處理后的數(shù)據(jù)與未攜帶噪聲的歷史語音數(shù)據(jù)進行特征比對,持續(xù)優(yōu)化模型的參數(shù)和算法,使得訓練得到的預(yù)處理模型能夠更有效地識別和去除噪聲干擾,為后續(xù)的語音識別模型提供更清晰、準確的輸入信號,確保只有高質(zhì)量的語音數(shù)據(jù)進入識別流程,顯著提高語音識別模型的識別準確性。

20、本發(fā)明的其他特征和優(yōu)點將在隨后的說明書闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明實施例了解。



技術(shù)特征:

1.一種語音識別方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的語音識別方法,其特征在于,對處理后的語音數(shù)據(jù)和未攜帶噪聲的歷史語音數(shù)據(jù)進行特征提取,分別得到第一語音特征和第二語音特征,包括:

3.根據(jù)權(quán)利要求2所述的語音識別方法,其特征在于,對所有目標聚類集合中的子音頻數(shù)據(jù)進行特征提取,并將提取到的多個特征進行聚合處理,得到所述第一語音特征,包括:

4.根據(jù)權(quán)利要求1所述的語音識別方法,其特征在于,構(gòu)建所述語音識別模型,包括:

5.根據(jù)權(quán)利要求4所述的語音識別方法,其特征在于,基于混沌映射對麻雀種群位置初始化,獲得多個初始位置參數(shù),包括:

6.根據(jù)權(quán)利要求5所述的語音識別方法,其特征在于,初始位置參數(shù)計算公式為:

7.根據(jù)權(quán)利要求4所述的語音識別方法,其特征在于,發(fā)現(xiàn)者的位置更新公式為:

8.一種語音識別裝置,其特征在于,包括:

9.根據(jù)權(quán)利要求8所述的語音識別裝置,其特征在于,所述提取單元包括:

10.根據(jù)權(quán)利要求9所述的語音識別裝置,其特征在于,所述聚合單元包括:


技術(shù)總結(jié)
本發(fā)明提供了一種語音識別方法、裝置、設(shè)備及可讀存儲介質(zhì),涉及語音識別技術(shù)領(lǐng)域,包括獲取歷史音頻數(shù)據(jù);得到處理后的語音數(shù)據(jù);進行特征提取得到第一語音特征和第二語音特征;當相似度大于第一設(shè)定閾值時,將預(yù)設(shè)的目標音頻數(shù)據(jù)輸入預(yù)處理模型中進行預(yù)處理,得到目標語音數(shù)據(jù);得到語音識別結(jié)果。本發(fā)明通過將攜帶噪聲的歷史語音數(shù)據(jù)輸入模型進行預(yù)處理,并將處理后的數(shù)據(jù)與未攜帶噪聲的歷史語音數(shù)據(jù)進行特征比對,持續(xù)優(yōu)化模型的參數(shù)和算法,使得訓練得到的預(yù)處理模型能夠更有效地識別和去除噪聲干擾,為后續(xù)的語音識別模型提供更清晰、準確的輸入信號,確保只有高質(zhì)量的語音數(shù)據(jù)進入識別流程,顯著提高語音識別模型的識別準確性。

技術(shù)研發(fā)人員:彭德偉,文裕光,劉濤,曹鶴,魏琪
受保護的技術(shù)使用者:四川信云調(diào)科技服務(wù)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/5/29
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1