本發(fā)明涉及音頻編碼領(lǐng)域,具體是一種音頻帶寬擴(kuò)展的方法及擴(kuò)展裝置。
背景技術(shù):
心理聲學(xué)研究表明人們對(duì)于音頻不同頻率下的敏感性具有差異,對(duì)低頻更敏感而對(duì)高頻不敏感,因此在音頻編碼中常常不對(duì)高頻進(jìn)行編碼以節(jié)省碼率。而高頻部分的完全缺失又會(huì)帶來(lái)聽(tīng)感上的不適,因此往往采用帶寬擴(kuò)展的方式恢復(fù)高頻?;趌pc的帶寬擴(kuò)展技術(shù)是目前低碼率、低復(fù)雜度的代表技術(shù)。它通過(guò)提取表征高頻包絡(luò)的lpc參數(shù),子帶能量,然后對(duì)得到高頻的低頻信號(hào)進(jìn)行調(diào)整,從而完成高頻重建。我國(guó)自主研發(fā)的移動(dòng)音頻編解碼器avs-p10也采用了這種帶寬擴(kuò)展方法。
在對(duì)現(xiàn)有方法的研究和實(shí)踐中,存在以下弊端:算法中對(duì)于信號(hào)的高頻部分統(tǒng)一通過(guò)基于語(yǔ)音產(chǎn)生原理的lpc的帶寬擴(kuò)展算法進(jìn)行編碼,通過(guò)將低頻信號(hào)的殘差信號(hào)作為高頻激勵(lì)并結(jié)合線性預(yù)測(cè)編碼技術(shù)實(shí)現(xiàn)高頻的重建。從原理上來(lái)看,avs-p10帶寬擴(kuò)展技術(shù)采用的一種典型的參數(shù)編碼技術(shù)。其對(duì)語(yǔ)音信號(hào)的高頻重建具有良好的效果,而對(duì)音樂(lè)信號(hào)的高頻重建效果不佳,不能根據(jù)信號(hào)的類型與特征做自適應(yīng)的調(diào)整。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種音頻帶寬擴(kuò)展的方法及擴(kuò)展裝置,以解決上述背景技術(shù)中提出的問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
一種音頻帶寬擴(kuò)展的方法,包括如下步驟:
步驟1,通過(guò)檢測(cè)當(dāng)前幀信號(hào)在混合acelp/tvc核心編碼器中的編碼模式來(lái)區(qū)分信號(hào)類型;
若當(dāng)前幀信號(hào)在核心編碼器的編碼模式為acelp256,則當(dāng)前幀為語(yǔ)音信號(hào);
若當(dāng)前幀信號(hào)在核心編碼器的編碼模式為tvc256、tvc512、tvc1024,則當(dāng)前幀為音樂(lè)信號(hào);
步驟2,同時(shí)基于信號(hào)類型分別對(duì)語(yǔ)音和音樂(lè)信號(hào)選擇自適應(yīng)的高頻重建策略;
若為語(yǔ)音信號(hào),則采用基于lpc的帶寬擴(kuò)展方法;
若為音樂(lè)信號(hào),則采用基于高低頻信號(hào)相關(guān)性的頻帶復(fù)制帶寬擴(kuò)展方法。
作為本發(fā)明進(jìn)一步方案:所述對(duì)于語(yǔ)音信號(hào),采用基于lpc的帶寬擴(kuò)展方法具體為:
(1)提取低頻殘差信號(hào)作為激勵(lì)信號(hào);
低帶原始信號(hào)經(jīng)過(guò)低帶線性預(yù)測(cè)逆濾波器濾波后得到低帶殘差信號(hào)作為激勵(lì)信號(hào),低帶的線性預(yù)測(cè)系數(shù)每幀更新一次;每一個(gè)1024樣點(diǎn)超幀的低帶激勵(lì)信號(hào)通過(guò)長(zhǎng)度為288樣點(diǎn),重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗分割為四個(gè)長(zhǎng)度288樣點(diǎn)的幀
(2)提取高頻lpc系數(shù),表征高頻包絡(luò)信息;
對(duì)每一幀高頻原始信號(hào)進(jìn)行一次八階線性預(yù)測(cè)分析,得到一組八階的線性預(yù)測(cè)編碼系數(shù),并轉(zhuǎn)換為導(dǎo)抗頻譜對(duì)系數(shù),導(dǎo)抗頻譜對(duì)系數(shù)進(jìn)一步變換為導(dǎo)抗譜頻率系數(shù);量化后的導(dǎo)抗譜頻率系數(shù)變換為量化后線性預(yù)測(cè)系數(shù),并以此產(chǎn)生高頻合成濾波器;假設(shè)高頻合成濾波器288點(diǎn)的沖擊響應(yīng)為,用288點(diǎn)的快速傅里葉變換將變換到頻域,以此表示原始高頻信號(hào)的頻譜包絡(luò);
(3)利用高頻包絡(luò)信息和低頻殘差信號(hào)得到準(zhǔn)高頻信號(hào);
每一幀的低帶激勵(lì)信號(hào)和高帶合成濾波器的沖擊響應(yīng)用288點(diǎn)的fft變換到頻域;高帶合成濾波器沖擊響應(yīng)的288點(diǎn)fft系數(shù)用其中的最大值歸一化;將低帶激勵(lì)信號(hào)的fft系數(shù)乘以歸一化的高帶合成濾波器的沖擊響應(yīng)fft系數(shù)就可以得到頻域的基礎(chǔ)信號(hào);
(4)提取高低頻對(duì)應(yīng)頻帶之間的增益信息;
計(jì)算288樣點(diǎn)幀準(zhǔn)高頻信號(hào)和原始高頻信號(hào)對(duì)應(yīng)子帶間的能量增益,
(5)利用高頻信號(hào)的譜包絡(luò)信息及增益信息調(diào)整原始低頻信號(hào)生成的高頻激勵(lì)信號(hào)來(lái)重建高頻信號(hào)。
作為本發(fā)明進(jìn)一步方案:所述對(duì)于音樂(lè)信號(hào),采用基于高低頻信號(hào)相關(guān)性的頻帶復(fù)制帶寬擴(kuò)展方法具體為:
(1)對(duì)原始高低頻信號(hào)進(jìn)行加窗并變換到頻域;
利用重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗對(duì)每一個(gè)256樣點(diǎn)幀的原始高低頻信號(hào)進(jìn)行加窗,得到288樣點(diǎn)幀;對(duì)加窗后的原始信號(hào)和高頻信號(hào)通過(guò)fft變換到頻域;
(2)計(jì)算高低頻信號(hào)對(duì)應(yīng)頻帶之間的相關(guān)性,若相關(guān)性較高,則將低頻信號(hào)復(fù)制到高頻頻段用于高頻重建;若高低頻信號(hào)之間的相關(guān)性較低,則將白噪聲信號(hào)填充到高頻頻段用于高頻重建;
針對(duì)每一個(gè)288樣點(diǎn)幀,計(jì)算對(duì)應(yīng)高低頻信號(hào)之間的相關(guān)性,從而確定用低頻信號(hào)還是白噪聲信號(hào)來(lái)重建;
(3)提取能量參數(shù);
若采用低頻信號(hào)來(lái)復(fù)制高頻信號(hào),需提取對(duì)應(yīng)低頻子帶的能量增益;若采用白噪聲重建高頻,則需提取高頻子帶平均能量;
(4)利用能量參數(shù)調(diào)整復(fù)制的低頻信號(hào)或白噪聲信號(hào)完成高頻重建。
一種所述音頻帶寬擴(kuò)展的擴(kuò)展裝置,包括信號(hào)類型檢測(cè)模塊、語(yǔ)音信號(hào)帶寬擴(kuò)展模塊和音樂(lè)信號(hào)帶寬擴(kuò)展模塊,
所述信號(hào)類型檢測(cè)模塊,用于檢測(cè)當(dāng)前幀信號(hào)在混合acelp/tvc核心編碼器中的編碼模式來(lái)區(qū)分信號(hào)類型;
所述語(yǔ)音信號(hào)帶寬擴(kuò)展模塊,用于完成語(yǔ)音幀信號(hào)的高頻重建,
所述音樂(lè)信號(hào)帶寬擴(kuò)展模塊,用于完成音樂(lè)幀信號(hào)的高頻重建。
作為本發(fā)明進(jìn)一步方案:所述語(yǔ)音信號(hào)帶寬擴(kuò)展模塊包括:
低頻殘差提取模塊,提取低頻殘差信號(hào)作為激勵(lì)信號(hào),低帶原始信號(hào)經(jīng)過(guò)低帶線性預(yù)測(cè)逆濾波器濾波后得到低帶殘差信號(hào)作為激勵(lì)信號(hào),低帶的線性預(yù)測(cè)系數(shù)每幀更新一次;每一個(gè)1024樣點(diǎn)超幀的低帶激勵(lì)信號(hào)通過(guò)長(zhǎng)度為288樣點(diǎn),重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗分割為四個(gè)長(zhǎng)度288樣點(diǎn)的幀;
包絡(luò)信息提取模塊,提取高頻lpc系數(shù),表征高頻包絡(luò)信息,提取高頻lpc系數(shù),表征高頻包絡(luò)信息,具體為,對(duì)每一幀高頻原始信號(hào)進(jìn)行一次八階線性預(yù)測(cè)分析,得到一組八階的線性預(yù)測(cè)編碼系數(shù),并轉(zhuǎn)換為導(dǎo)抗頻譜對(duì)系數(shù),導(dǎo)抗頻譜對(duì)系數(shù)進(jìn)一步變換為導(dǎo)抗譜頻率系數(shù);量化后的isf系數(shù)變換為量化后線性預(yù)測(cè)系數(shù),并以此產(chǎn)生高頻合成濾波器;假設(shè)高頻合成濾波器288點(diǎn)的沖擊響應(yīng)為,用288點(diǎn)的快速傅里葉變換將變換到頻域,以此表示原始高頻信號(hào)的頻譜包絡(luò);
增益提取模塊,提取高頻與準(zhǔn)高頻信號(hào)之間的對(duì)應(yīng)頻帶之間的增益信息,計(jì)算288樣點(diǎn)幀準(zhǔn)高頻信號(hào)和原對(duì)應(yīng)子帶間的能量增益,并進(jìn)行編碼傳遞到解碼端;
重建模塊,用于利用增益信息調(diào)整調(diào)整準(zhǔn)高頻信號(hào)完成高頻重建。
作為本發(fā)明再進(jìn)一步方案:所述音樂(lè)信號(hào)帶寬擴(kuò)展模塊包括:
加窗轉(zhuǎn)換模塊,對(duì)原始高低頻信號(hào)進(jìn)行加窗并變換到頻域,利用重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗對(duì)每一個(gè)256樣點(diǎn)幀的原始高低頻信號(hào)進(jìn)行加窗,得到288樣點(diǎn)幀;對(duì)加窗后的原始信號(hào)和高頻信號(hào)通過(guò)fft變換到頻域;
相關(guān)性計(jì)算模塊,計(jì)算高低頻信號(hào)對(duì)應(yīng)頻帶之間的相關(guān)性,針對(duì)每一個(gè)288樣點(diǎn)幀,計(jì)算對(duì)應(yīng)高低頻信號(hào)之間的相關(guān)性,從而確定用低頻信號(hào)還是白噪聲信號(hào)來(lái)重建;
能量參數(shù)提取模塊,提取指導(dǎo)高頻重建所需的能量參數(shù),采用低頻信號(hào)來(lái)復(fù)制高頻信號(hào),需提取對(duì)應(yīng)低頻子帶的能量增益;若采用白噪聲重建高頻,則需提取高頻子帶平均能量;
重建模塊,用于利用能量參數(shù)調(diào)整低頻或白噪聲信號(hào)完成高頻重建。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
本發(fā)明充分考慮到了不同信號(hào)類型的特性,從信號(hào)類型的角度著手,通過(guò)檢測(cè)當(dāng)前幀信號(hào)的acelp/tvc編碼模式判斷當(dāng)前幀的信號(hào)類型(語(yǔ)音/音樂(lè)),再基于信號(hào)類型分別對(duì)語(yǔ)音和音樂(lè)信號(hào)進(jìn)行自適應(yīng)的高頻重建策略,以提高音頻恢復(fù)質(zhì)量。因此本發(fā)明實(shí)施例技術(shù)方案能夠更準(zhǔn)確的進(jìn)行高頻重建。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例帶寬擴(kuò)展的方法流程圖。
圖2是本發(fā)明實(shí)施例語(yǔ)音幀信號(hào)高頻重建策略流程圖。
圖3是本發(fā)明實(shí)施例音樂(lè)幀信號(hào)高頻重建策略流程圖。
圖4是本發(fā)明實(shí)施例帶寬擴(kuò)展的模塊裝置圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
如圖1所示,是本發(fā)明實(shí)施例的方法流程圖,音頻帶寬擴(kuò)展的方法,包括以下步驟:
步驟101:檢測(cè)當(dāng)前幀信號(hào)在混合acelp/tvc核心編碼器中的編碼模式來(lái)區(qū)分信號(hào)類型,若當(dāng)前幀信號(hào)在核心編碼器的編碼模式為acelp256,則當(dāng)前幀為語(yǔ)音信號(hào);若當(dāng)前幀信號(hào)在核心編碼器的編碼模式為tvc256、tvc512、tvc1024,則當(dāng)前幀為音樂(lè)信號(hào);
步驟102:基于信號(hào)類型分別對(duì)語(yǔ)音和音樂(lè)信號(hào)選擇自適應(yīng)的高頻重建策略,若為語(yǔ)音信號(hào),則采用基于lpc的帶寬擴(kuò)展策略;若為音樂(lè)信號(hào),則采用基于高低頻信號(hào)相關(guān)性的頻帶復(fù)制帶寬擴(kuò)展策略。
本發(fā)明針對(duì)語(yǔ)音幀信號(hào)和音樂(lè)幀信號(hào)分別采用不同的帶寬擴(kuò)展策略,下面將分別介紹。
如圖2所示,是本發(fā)明實(shí)施例語(yǔ)音幀信號(hào)高頻重建策略流程圖,包括以下步驟:
步驟201,提取低頻殘差信號(hào)作為激勵(lì)信號(hào),低帶原始信號(hào)經(jīng)過(guò)低帶線性預(yù)測(cè)逆濾波器濾波后得到低帶殘差信號(hào)作為激勵(lì)信號(hào),低帶的線性預(yù)測(cè)系數(shù)每幀更新一次。每一個(gè)1024樣點(diǎn)超幀的低帶激勵(lì)信號(hào)通過(guò)長(zhǎng)度為288樣點(diǎn),重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗分割為四個(gè)長(zhǎng)度288樣點(diǎn)的幀。
步驟202,提取高頻lpc系數(shù)表征高頻包絡(luò)信息,對(duì)每一幀高頻原始信號(hào)進(jìn)行一次八階線性預(yù)測(cè)分析,得到一組八階的線性預(yù)測(cè)編碼(lpc)系數(shù),并轉(zhuǎn)換為導(dǎo)抗頻譜對(duì)(isp)系數(shù),導(dǎo)抗頻譜對(duì)系數(shù)進(jìn)一步變換為導(dǎo)抗譜頻率(isf)系數(shù)。量化后的isf系數(shù)變換為量化后線性預(yù)測(cè)系數(shù),并以此產(chǎn)生高頻合成濾波器。假設(shè)高頻合成濾波器288點(diǎn)的沖擊響應(yīng)為,用288點(diǎn)的快速傅里葉變換(fft)將變換到頻域,以此表示原始高頻信號(hào)的頻譜包絡(luò)。
步驟203,利用步驟202得到的高頻包絡(luò)信息和步驟201得到的低頻殘差信號(hào)得到準(zhǔn)高頻信號(hào),每一幀的低帶激勵(lì)信號(hào)和高帶合成濾波器的沖擊響應(yīng)用288點(diǎn)的fft變換到頻域。高帶合成濾波器沖擊響應(yīng)的288點(diǎn)fft系數(shù)用其中的最大值歸一化。將低帶激勵(lì)信號(hào)的fft系數(shù)乘以歸一化的高帶合成濾波器的沖擊響應(yīng)fft系數(shù)就可以得到頻域的準(zhǔn)高頻信號(hào)。
步驟204,提取增益信息,計(jì)算288樣點(diǎn)幀準(zhǔn)高頻信號(hào)和原始高頻信號(hào)對(duì)應(yīng)子帶間的能量增益。
步驟205,高頻重建,利用步驟204得到的能量增益調(diào)整步驟203得到的準(zhǔn)高頻信號(hào)完成高頻重建。
如圖3所示,是本發(fā)明實(shí)施例音樂(lè)幀信號(hào)高頻重建策略流程圖,包括以下步驟:
步驟301,對(duì)原始高低頻信號(hào)進(jìn)行加窗并變換到頻域,利用重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗對(duì)每一個(gè)256樣點(diǎn)幀的原始高低頻信號(hào)進(jìn)行加窗,得到288樣點(diǎn)幀。對(duì)加窗后的原始信號(hào)和高頻信號(hào)通過(guò)fft變換到頻域。
步驟302,計(jì)算高低頻信號(hào)對(duì)應(yīng)頻帶之間的相關(guān)性,針對(duì)每一個(gè)288樣點(diǎn)幀,通過(guò)計(jì)算對(duì)應(yīng)高低頻信號(hào)之間的相關(guān)性,從而確定用低頻信號(hào)還是白噪聲信號(hào)來(lái)重建。
步驟303,提取能量參數(shù),根據(jù)步驟302相關(guān)性計(jì)算判斷的結(jié)果,若采用低頻信號(hào)來(lái)復(fù)制高頻信號(hào),需提取對(duì)應(yīng)低頻子帶的能量增益。若采用白噪聲重建高頻,則需提取高頻子帶平均能量。
步驟304,高頻重建,利用步驟303得到的能量參數(shù)調(diào)整步驟304得到的激勵(lì)信號(hào)完成高頻重建。
如圖4所示,一種音頻帶寬擴(kuò)展的裝置,包括:信號(hào)類型檢測(cè)模塊401、語(yǔ)音信號(hào)帶寬擴(kuò)展模塊402、音樂(lè)信號(hào)帶寬擴(kuò)展模塊403。
信號(hào)類型檢測(cè)模塊401,用于檢測(cè)當(dāng)前幀信號(hào)在混合acelp/tvc核心編碼器中的編碼模式來(lái)區(qū)分信號(hào)類型。
語(yǔ)音信號(hào)帶寬擴(kuò)展模塊402,用于完成語(yǔ)音幀信號(hào)的高頻重建;
音樂(lè)信號(hào)帶寬擴(kuò)展模塊403,用于完成音樂(lè)幀信號(hào)的高頻重建。
所述語(yǔ)音信號(hào)帶寬擴(kuò)展模塊402,進(jìn)一步包括:低頻殘差提取模塊4021,包絡(luò)信息提取模塊4022,增益提取模塊4023,重建模塊4024。
低頻殘差提取模塊4021,用于提取低頻殘差信號(hào)作為激勵(lì)信號(hào);
包絡(luò)信息提取模塊4022,用于提取高頻lpc系數(shù),表征高頻包絡(luò)信息;
增益提取模塊4023,用于提取高頻與準(zhǔn)高頻信號(hào)之間的對(duì)應(yīng)頻帶之間的增益信息;
重建模塊4024,用于利用增益信息調(diào)整調(diào)整準(zhǔn)高頻信號(hào)完成高頻重建。
所述音樂(lè)信號(hào)帶寬擴(kuò)展模塊,進(jìn)一步包括:加窗轉(zhuǎn)換模塊4031,相關(guān)性計(jì)算模塊4032,能量參數(shù)提取模塊4033,重建模塊4034。
加窗轉(zhuǎn)換模塊4031,用于對(duì)原始高低頻信號(hào)進(jìn)行加窗并變換到頻域。
相關(guān)性計(jì)算模塊4032,用于計(jì)算高低頻信號(hào)對(duì)應(yīng)頻帶之間的相關(guān)性。
能量參數(shù)提取模塊4033,用于提取指導(dǎo)高頻重建所需的能量參數(shù)。
重建模塊4034,用于利用能量參數(shù)調(diào)整低頻或白噪聲信號(hào)完成高頻重建。
對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無(wú)論從哪一點(diǎn)來(lái)看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說(shuō)明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。