本申請(qǐng)實(shí)施例涉及計(jì)算機(jī),特別涉及一種語音數(shù)據(jù)處理方法及裝置。
背景技術(shù):
1、聲紋是指聲音信號(hào)在頻率、幅度和時(shí)域上的特征和規(guī)律,就像指紋一樣具有唯一性。它是由聲帶、口腔、鼻腔等發(fā)聲器官的結(jié)構(gòu)和使用習(xí)慣決定的。每個(gè)人的發(fā)音講話都是鼻腔、口舌、聲道、胸肺等器官多重配合的結(jié)果,不同人說話的頻率、音色、語調(diào)甚至口音等都有細(xì)微差別,這些差別最終組成全然不同的聲紋圖譜。
2、由于聲紋具有唯一性,故很多設(shè)備、程序在進(jìn)行用戶識(shí)別時(shí)會(huì)采用聲紋進(jìn)行身份識(shí)別。但是隨著人的情緒或身體狀態(tài)等因素影響,聲紋實(shí)際上也是時(shí)刻變化的,因此進(jìn)行聲紋識(shí)別時(shí)往往會(huì)遇到無法識(shí)別的現(xiàn)象,此時(shí)均需用戶人為手動(dòng)操作處理。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供了一種語音數(shù)據(jù)處理方法,包括:
2、響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得,確定目標(biāo)用戶,并對(duì)所述語音數(shù)據(jù)與目標(biāo)用戶間的匹配關(guān)系進(jìn)行識(shí)別;
3、響應(yīng)于識(shí)別結(jié)果為第一識(shí)別結(jié)果,確定所述語音數(shù)據(jù)為單人語音數(shù)據(jù)或多人語音數(shù)據(jù);
4、在為單人語音數(shù)據(jù)時(shí),對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理;
5、在為多人語音數(shù)據(jù)時(shí),對(duì)所述語音數(shù)據(jù)進(jìn)行第二處理,所述第二處理與第一處理不同,所述第一處理與第二處理均用于得到對(duì)應(yīng)所述目標(biāo)用戶的聲紋數(shù)據(jù);
6、基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè)。
7、在一實(shí)施例中,所述方法還包括:
8、響應(yīng)于第二時(shí)刻的語音數(shù)據(jù)的獲得,對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理或第二處理,得到對(duì)應(yīng)第二時(shí)刻的第一處理結(jié)果或第二處理結(jié)果;
9、將第二時(shí)刻與第一時(shí)刻的第一處理結(jié)果、第二處理結(jié)果進(jìn)行對(duì)應(yīng)匹配,得到第一匹配結(jié)果;
10、若所述第一匹配結(jié)果表征相似度滿足要求,則基于第二時(shí)刻的第一處理結(jié)果或第二處理結(jié)果進(jìn)行目標(biāo)用戶的聲紋注冊(cè)。
11、在一實(shí)施例中,所述方法還包括:
12、若所述第一匹配結(jié)果表征相似度不滿足要求,則獲取第三時(shí)刻的語音數(shù)據(jù),并對(duì)所述第三時(shí)刻的語音數(shù)據(jù)進(jìn)行第一處理或第二處理,得到對(duì)應(yīng)第三時(shí)刻的第一處理結(jié)果或第二處理結(jié)果;
13、將第一時(shí)刻、第二時(shí)刻與第三時(shí)刻的第一處理結(jié)果、第二處理結(jié)果進(jìn)行對(duì)應(yīng)匹配,得到不同的第二匹配結(jié)果;
14、基于相似度滿足要求的所述第二匹配結(jié)果對(duì)應(yīng)的兩個(gè)時(shí)刻的第一處理結(jié)果或第二處理結(jié)果進(jìn)行目標(biāo)用戶的聲紋注冊(cè)。
15、在一實(shí)施例中,所述確定目標(biāo)用戶,包括:
16、獲得設(shè)備信息,基于所述設(shè)備信息確定所述目標(biāo)用戶;或
17、獲得目標(biāo)程序的注冊(cè)信息,基于所述注冊(cè)信息確定所述目標(biāo)用戶;或
18、基于輸入的身份信息確定目標(biāo)用戶;或
19、基于已存儲(chǔ)的歷史聲紋注冊(cè)數(shù)據(jù)確定目標(biāo)用戶。
20、在一實(shí)施例中,所述響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得,包括:
21、響應(yīng)于第一時(shí)刻的指定聲音頻率范圍內(nèi)的語音數(shù)據(jù)的獲得;或
22、響應(yīng)于第一時(shí)刻的音量滿足要求的語音數(shù)據(jù)的獲得;或
23、在確定有音頻的輸入與輸出時(shí),響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得;或
24、在確定啟動(dòng)了目標(biāo)功能時(shí),響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得;或
25、在確定啟動(dòng)了目標(biāo)程序時(shí),響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得。
26、在一實(shí)施例中,所述對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理,包括:
27、確定所述語音數(shù)據(jù)的音量、時(shí)長;
28、在所述語音數(shù)據(jù)的音量、時(shí)長滿足第一要求的情況下,基于所述語音數(shù)據(jù)確定對(duì)應(yīng)目標(biāo)用戶的聲紋數(shù)據(jù)。
29、在一實(shí)施例中,對(duì)所述語音數(shù)據(jù)進(jìn)行第二處理,包括:
30、對(duì)所述語音數(shù)據(jù)進(jìn)行多人音頻分離計(jì)算,提取出對(duì)應(yīng)所述目標(biāo)用戶的目標(biāo)語音數(shù)據(jù);
31、確定所述語音數(shù)據(jù)的音量、時(shí)長;
32、在所述語音數(shù)據(jù)的音量、時(shí)長滿足第一要求的情況下,基于所述語音數(shù)據(jù)確定對(duì)應(yīng)目標(biāo)用戶的聲紋數(shù)據(jù)。
33、在一實(shí)施例中,所述對(duì)所述語音數(shù)據(jù)進(jìn)行多人音頻分離計(jì)算,提取出對(duì)應(yīng)所述目標(biāo)用戶的目標(biāo)語音數(shù)據(jù),包括:
34、確定采集的多個(gè)語音數(shù)據(jù)分別對(duì)應(yīng)的采集角度;
35、提取出對(duì)應(yīng)目標(biāo)角度的語音數(shù)據(jù)為目標(biāo)用戶的目標(biāo)語音數(shù)據(jù);或
36、確定采集的多個(gè)語音數(shù)據(jù)分別對(duì)應(yīng)的采集距離;
37、提取出對(duì)應(yīng)目標(biāo)距離的語音數(shù)據(jù)為目標(biāo)用戶的目標(biāo)語音數(shù)據(jù)
38、確定采集的多個(gè)語音數(shù)據(jù)分別對(duì)應(yīng)的音頻參數(shù);
39、提取出具有目標(biāo)音頻參數(shù)的語音數(shù)據(jù)為目標(biāo)用戶的目標(biāo)語音數(shù)據(jù)。
40、在一實(shí)施例中,所述基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè),包括:
41、響應(yīng)于輸入指令,基于所述第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè);或
42、響應(yīng)于輸入指令,基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的歷史聲紋注冊(cè)數(shù)據(jù)的更新。
43、本申請(qǐng)另一實(shí)施例同時(shí)提供一種語音數(shù)據(jù)處理裝置,包括:
44、第一響應(yīng)模塊,用于響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得,確定目標(biāo)用戶,并對(duì)所述語音數(shù)據(jù)與目標(biāo)用戶間的匹配關(guān)系進(jìn)行識(shí)別;
45、第二響應(yīng)模塊,用于響應(yīng)于識(shí)別結(jié)果為第一識(shí)別結(jié)果,確定所述語音數(shù)據(jù)為單人語音數(shù)據(jù)或多人語音數(shù)據(jù);
46、第一處理模塊,用于在為單人語音數(shù)據(jù)時(shí),對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理;
47、第二處理模塊,用于在為多人語音數(shù)據(jù)時(shí),對(duì)所述語音數(shù)據(jù)進(jìn)行第二處理,所述第二處理與第一處理不同,所述第一處理與第二處理均用于得到對(duì)應(yīng)所述目標(biāo)用戶的聲紋數(shù)據(jù);
48、注冊(cè)模塊,用于基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè)。
49、本申請(qǐng)的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本申請(qǐng)而了解。本申請(qǐng)的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
50、下面通過附圖和實(shí)施例,對(duì)本申請(qǐng)的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
1.一種語音數(shù)據(jù)處理方法,包括:
2.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法,其中,所述方法還包括:
3.根據(jù)權(quán)利要求2所述的語音數(shù)據(jù)處理方法,其中,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法,其中,所述確定目標(biāo)用戶,包括:
5.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法,其中,所述響應(yīng)于第一時(shí)刻的語音數(shù)據(jù)的獲得,包括:
6.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法,其中,所述對(duì)所述語音數(shù)據(jù)進(jìn)行第一處理,包括:
7.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法,其中,對(duì)所述語音數(shù)據(jù)進(jìn)行第二處理,包括:
8.根據(jù)權(quán)利要求9所述的語音數(shù)據(jù)處理方法,其中,所述對(duì)所述語音數(shù)據(jù)進(jìn)行多人音頻分離計(jì)算,提取出對(duì)應(yīng)所述目標(biāo)用戶的目標(biāo)語音數(shù)據(jù),包括:
9.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)處理方法,其中,所述基于第一處理結(jié)果或第二處理結(jié)果進(jìn)行所述目標(biāo)用戶的聲紋注冊(cè),包括:
10.一種語音數(shù)據(jù)處理裝置,包括: