一種語音數(shù)據(jù)處理方法及裝置與流程

文檔序號(hào)：42035035發(fā)布日期：2025-05-30 17:27閱讀：9來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本申請(qǐng)實(shí)施例涉及計(jì)算機(jī)，特別涉及一種語音數(shù)據(jù)處理方法及裝置。

背景技術(shù)：

1、聲紋是指聲音信號(hào)在頻率、幅度和時(shí)域上的特征和規(guī)律，就像指紋一樣具有唯一性。它是由聲帶、口腔、鼻腔等發(fā)聲器官的結(jié)構(gòu)和使用習(xí)慣決定的。每個(gè)人的發(fā)音講話都是鼻腔、口舌、聲道、胸肺等器官多重配合的結(jié)果，不同人說話的頻率、音色、語調(diào)甚至口音等都有細(xì)微差別，這些差別最終組成全然不同的聲紋圖譜。

2、由于聲紋具有唯一性，故很多設(shè)備、程序在進(jìn)行用戶識(shí)別時(shí)會(huì)采用聲紋進(jìn)行身份識(shí)別。但是隨著人的情緒或身體狀態(tài)等因素影響，聲紋實(shí)際上也是時(shí)刻變化的，因此進(jìn)行聲紋識(shí)別時(shí)往往會(huì)遇到無法識(shí)別的現(xiàn)象，此時(shí)均需用戶人為手動(dòng)操作處理。

技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)實(shí)施例提供了一種語音數(shù)據(jù)處理方法，包括：

2、響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得，確定目標(biāo)用戶，并對(duì)所述語音數(shù)據(jù)與目標(biāo)用戶間的匹配關(guān)系進(jìn)行識(shí)別；

3、響應(yīng)于識(shí)別結(jié)果為第一識(shí)別結(jié)果，確定所述語音數(shù)據(jù)為單人語音數(shù)據(jù)或多人語音數(shù)據(jù)；

4、在為單人語音數(shù)據(jù)時(shí)，對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理；

5、在為多人語音數(shù)據(jù)時(shí)，對(duì)所述語音數(shù)據(jù)進(jìn)行第二處理，所述第二處理與第一處理不同，所述第一處理與第二處理均用于得到對(duì)應(yīng)所述目標(biāo)用戶的聲紋數(shù)據(jù)；

6、基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè)。

7、在一實(shí)施例中，所述方法還包括：

8、響應(yīng)于第二時(shí)刻的語音數(shù)據(jù)的獲得，對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理或第二處理，得到對(duì)應(yīng)第二時(shí)刻的第一處理結(jié)果或第二處理結(jié)果；

9、將第二時(shí)刻與第一時(shí)刻的第一處理結(jié)果、第二處理結(jié)果進(jìn)行對(duì)應(yīng)匹配，得到第一匹配結(jié)果；

10、若所述第一匹配結(jié)果表征相似度滿足要求，則基于第二時(shí)刻的第一處理結(jié)果或第二處理結(jié)果進(jìn)行目標(biāo)用戶的聲紋注冊(cè)。

11、在一實(shí)施例中，所述方法還包括：

12、若所述第一匹配結(jié)果表征相似度不滿足要求，則獲取第三時(shí)刻的語音數(shù)據(jù)，并對(duì)所述第三時(shí)刻的語音數(shù)據(jù)進(jìn)行第一處理或第二處理，得到對(duì)應(yīng)第三時(shí)刻的第一處理結(jié)果或第二處理結(jié)果；

13、將第一時(shí)刻、第二時(shí)刻與第三時(shí)刻的第一處理結(jié)果、第二處理結(jié)果進(jìn)行對(duì)應(yīng)匹配，得到不同的第二匹配結(jié)果；

14、基于相似度滿足要求的所述第二匹配結(jié)果對(duì)應(yīng)的兩個(gè)時(shí)刻的第一處理結(jié)果或第二處理結(jié)果進(jìn)行目標(biāo)用戶的聲紋注冊(cè)。

15、在一實(shí)施例中，所述確定目標(biāo)用戶，包括：

16、獲得設(shè)備信息，基于所述設(shè)備信息確定所述目標(biāo)用戶；或

17、獲得目標(biāo)程序的注冊(cè)信息，基于所述注冊(cè)信息確定所述目標(biāo)用戶；或

18、基于輸入的身份信息確定目標(biāo)用戶；或

19、基于已存儲(chǔ)的歷史聲紋注冊(cè)數(shù)據(jù)確定目標(biāo)用戶。

20、在一實(shí)施例中，所述響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得，包括:

21、響應(yīng)于第一時(shí)刻的指定聲音頻率范圍內(nèi)的語音數(shù)據(jù)的獲得；或

22、響應(yīng)于第一時(shí)刻的音量滿足要求的語音數(shù)據(jù)的獲得；或

23、在確定有音頻的輸入與輸出時(shí)，響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得；或

24、在確定啟動(dòng)了目標(biāo)功能時(shí)，響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得；或

25、在確定啟動(dòng)了目標(biāo)程序時(shí)，響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得。

26、在一實(shí)施例中，所述對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理，包括：

27、確定所述語音數(shù)據(jù)的音量、時(shí)長；

28、在所述語音數(shù)據(jù)的音量、時(shí)長滿足第一要求的情況下，基于所述語音數(shù)據(jù)確定對(duì)應(yīng)目標(biāo)用戶的聲紋數(shù)據(jù)。

29、在一實(shí)施例中，對(duì)所述語音數(shù)據(jù)進(jìn)行第二處理，包括：

30、對(duì)所述語音數(shù)據(jù)進(jìn)行多人音頻分離計(jì)算，提取出對(duì)應(yīng)所述目標(biāo)用戶的目標(biāo)語音數(shù)據(jù)；

31、確定所述語音數(shù)據(jù)的音量、時(shí)長；

32、在所述語音數(shù)據(jù)的音量、時(shí)長滿足第一要求的情況下，基于所述語音數(shù)據(jù)確定對(duì)應(yīng)目標(biāo)用戶的聲紋數(shù)據(jù)。

33、在一實(shí)施例中，所述對(duì)所述語音數(shù)據(jù)進(jìn)行多人音頻分離計(jì)算，提取出對(duì)應(yīng)所述目標(biāo)用戶的目標(biāo)語音數(shù)據(jù)，包括：

34、確定采集的多個(gè)語音數(shù)據(jù)分別對(duì)應(yīng)的采集角度；

35、提取出對(duì)應(yīng)目標(biāo)角度的語音數(shù)據(jù)為目標(biāo)用戶的目標(biāo)語音數(shù)據(jù)；或

36、確定采集的多個(gè)語音數(shù)據(jù)分別對(duì)應(yīng)的采集距離；

37、提取出對(duì)應(yīng)目標(biāo)距離的語音數(shù)據(jù)為目標(biāo)用戶的目標(biāo)語音數(shù)據(jù)

38、確定采集的多個(gè)語音數(shù)據(jù)分別對(duì)應(yīng)的音頻參數(shù)；

39、提取出具有目標(biāo)音頻參數(shù)的語音數(shù)據(jù)為目標(biāo)用戶的目標(biāo)語音數(shù)據(jù)。

40、在一實(shí)施例中，所述基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè)，包括：

41、響應(yīng)于輸入指令，基于所述第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè)；或

42、響應(yīng)于輸入指令，基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的歷史聲紋注冊(cè)數(shù)據(jù)的更新。

43、本申請(qǐng)另一實(shí)施例同時(shí)提供一種語音數(shù)據(jù)處理裝置，包括:

44、第一響應(yīng)模塊，用于響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得，確定目標(biāo)用戶，并對(duì)所述語音數(shù)據(jù)與目標(biāo)用戶間的匹配關(guān)系進(jìn)行識(shí)別；

45、第二響應(yīng)模塊，用于響應(yīng)于識(shí)別結(jié)果為第一識(shí)別結(jié)果，確定所述語音數(shù)據(jù)為單人語音數(shù)據(jù)或多人語音數(shù)據(jù)；

46、第一處理模塊，用于在為單人語音數(shù)據(jù)時(shí)，對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理；

47、第二處理模塊，用于在為多人語音數(shù)據(jù)時(shí)，對(duì)所述語音數(shù)據(jù)進(jìn)行第二處理，所述第二處理與第一處理不同，所述第一處理與第二處理均用于得到對(duì)應(yīng)所述目標(biāo)用戶的聲紋數(shù)據(jù)；

48、注冊(cè)模塊，用于基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè)。

49、本申請(qǐng)的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述，并且，部分地從說明書中變得顯而易見，或者通過實(shí)施本申請(qǐng)而了解。本申請(qǐng)的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。

50、下面通過附圖和實(shí)施例，對(duì)本申請(qǐng)的技術(shù)方案做進(jìn)一步的詳細(xì)描述。

技術(shù)特征：

1.一種語音數(shù)據(jù)處理方法，包括：

2.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法，其中，所述方法還包括：

3.根據(jù)權(quán)利要求2所述的語音數(shù)據(jù)處理方法，其中，所述方法還包括：

4.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法，其中，所述確定目標(biāo)用戶，包括：

5.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法，其中，所述響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得，包括:

6.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法，其中，所述對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理，包括：

7.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法，其中，對(duì)所述語音數(shù)據(jù)進(jìn)行第二處理，包括：

8.根據(jù)權(quán)利要求9所述的語音數(shù)據(jù)處理方法，其中，所述對(duì)所述語音數(shù)據(jù)進(jìn)行多人音頻分離計(jì)算，提取出對(duì)應(yīng)所述目標(biāo)用戶的目標(biāo)語音數(shù)據(jù)，包括：

9.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法，其中，所述基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè)，包括：

10.一種語音數(shù)據(jù)處理裝置，包括:

技術(shù)總結(jié)
本申請(qǐng)?zhí)峁┮环N語音數(shù)據(jù)處理方法及裝置，所述語音數(shù)據(jù)處理方法包括：響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得，確定目標(biāo)用戶，并對(duì)所述語音數(shù)據(jù)與目標(biāo)用戶間的匹配關(guān)系進(jìn)行識(shí)別；響應(yīng)于識(shí)別結(jié)果為第一識(shí)別結(jié)果，確定所述語音數(shù)據(jù)為單人語音數(shù)據(jù)或多人語音數(shù)據(jù)；在為單人語音數(shù)據(jù)時(shí)，對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理；在為多人語音數(shù)據(jù)時(shí)，對(duì)所述語音數(shù)據(jù)進(jìn)行第二處理，所述第二處理與第一處理不同，所述第一處理與第二處理均用于得到對(duì)應(yīng)所述目標(biāo)用戶的聲紋數(shù)據(jù)；基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè)。

技術(shù)研發(fā)人員：黃海鋒
受保護(hù)的技術(shù)使用者：聯(lián)想（北京）有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/29

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：黃海鋒
技術(shù)所有人：聯(lián)想（北京）有限公司
我是此專利的發(fā)明人

上一篇：一種相變儲(chǔ)能混凝土及其制備方法
下一篇：一種正極極片、二次電池和電子裝置的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種語音數(shù)據(jù)處理方法及裝置與流程