一種音頻帶寬擴(kuò)展的方法及擴(kuò)展裝置與流程

文檔序號(hào)：11202375閱讀：1013來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及音頻編碼領(lǐng)域，具體是一種音頻帶寬擴(kuò)展的方法及擴(kuò)展裝置。

背景技術(shù)：

心理聲學(xué)研究表明人們對(duì)于音頻不同頻率下的敏感性具有差異，對(duì)低頻更敏感而對(duì)高頻不敏感，因此在音頻編碼中常常不對(duì)高頻進(jìn)行編碼以節(jié)省碼率。而高頻部分的完全缺失又會(huì)帶來(lái)聽(tīng)感上的不適，因此往往采用帶寬擴(kuò)展的方式恢復(fù)高頻?；趌pc的帶寬擴(kuò)展技術(shù)是目前低碼率、低復(fù)雜度的代表技術(shù)。它通過(guò)提取表征高頻包絡(luò)的lpc參數(shù)，子帶能量，然后對(duì)得到高頻的低頻信號(hào)進(jìn)行調(diào)整，從而完成高頻重建。我國(guó)自主研發(fā)的移動(dòng)音頻編解碼器avs-p10也采用了這種帶寬擴(kuò)展方法。

在對(duì)現(xiàn)有方法的研究和實(shí)踐中，存在以下弊端：算法中對(duì)于信號(hào)的高頻部分統(tǒng)一通過(guò)基于語(yǔ)音產(chǎn)生原理的lpc的帶寬擴(kuò)展算法進(jìn)行編碼，通過(guò)將低頻信號(hào)的殘差信號(hào)作為高頻激勵(lì)并結(jié)合線性預(yù)測(cè)編碼技術(shù)實(shí)現(xiàn)高頻的重建。從原理上來(lái)看，avs-p10帶寬擴(kuò)展技術(shù)采用的一種典型的參數(shù)編碼技術(shù)。其對(duì)語(yǔ)音信號(hào)的高頻重建具有良好的效果，而對(duì)音樂(lè)信號(hào)的高頻重建效果不佳，不能根據(jù)信號(hào)的類型與特征做自適應(yīng)的調(diào)整。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明的目的在于提供一種音頻帶寬擴(kuò)展的方法及擴(kuò)展裝置，以解決上述背景技術(shù)中提出的問(wèn)題。

為實(shí)現(xiàn)上述目的，本發(fā)明提供如下技術(shù)方案：

一種音頻帶寬擴(kuò)展的方法，包括如下步驟：

步驟1，通過(guò)檢測(cè)當(dāng)前幀信號(hào)在混合acelp/tvc核心編碼器中的編碼模式來(lái)區(qū)分信號(hào)類型；

若當(dāng)前幀信號(hào)在核心編碼器的編碼模式為acelp256，則當(dāng)前幀為語(yǔ)音信號(hào)；

若當(dāng)前幀信號(hào)在核心編碼器的編碼模式為tvc256、tvc512、tvc1024，則當(dāng)前幀為音樂(lè)信號(hào)；

步驟2，同時(shí)基于信號(hào)類型分別對(duì)語(yǔ)音和音樂(lè)信號(hào)選擇自適應(yīng)的高頻重建策略；

若為語(yǔ)音信號(hào)，則采用基于lpc的帶寬擴(kuò)展方法；

若為音樂(lè)信號(hào)，則采用基于高低頻信號(hào)相關(guān)性的頻帶復(fù)制帶寬擴(kuò)展方法。

作為本發(fā)明進(jìn)一步方案：所述對(duì)于語(yǔ)音信號(hào)，采用基于lpc的帶寬擴(kuò)展方法具體為：

(1)提取低頻殘差信號(hào)作為激勵(lì)信號(hào)；

低帶原始信號(hào)經(jīng)過(guò)低帶線性預(yù)測(cè)逆濾波器濾波后得到低帶殘差信號(hào)作為激勵(lì)信號(hào)，低帶的線性預(yù)測(cè)系數(shù)每幀更新一次；每一個(gè)1024樣點(diǎn)超幀的低帶激勵(lì)信號(hào)通過(guò)長(zhǎng)度為288樣點(diǎn)，重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗分割為四個(gè)長(zhǎng)度288樣點(diǎn)的幀

(2)提取高頻lpc系數(shù)，表征高頻包絡(luò)信息；

對(duì)每一幀高頻原始信號(hào)進(jìn)行一次八階線性預(yù)測(cè)分析，得到一組八階的線性預(yù)測(cè)編碼系數(shù)，并轉(zhuǎn)換為導(dǎo)抗頻譜對(duì)系數(shù)，導(dǎo)抗頻譜對(duì)系數(shù)進(jìn)一步變換為導(dǎo)抗譜頻率系數(shù)；量化后的導(dǎo)抗譜頻率系數(shù)變換為量化后線性預(yù)測(cè)系數(shù)，并以此產(chǎn)生高頻合成濾波器；假設(shè)高頻合成濾波器288點(diǎn)的沖擊響應(yīng)為，用288點(diǎn)的快速傅里葉變換將變換到頻域，以此表示原始高頻信號(hào)的頻譜包絡(luò)；

(3)利用高頻包絡(luò)信息和低頻殘差信號(hào)得到準(zhǔn)高頻信號(hào)；

每一幀的低帶激勵(lì)信號(hào)和高帶合成濾波器的沖擊響應(yīng)用288點(diǎn)的fft變換到頻域；高帶合成濾波器沖擊響應(yīng)的288點(diǎn)fft系數(shù)用其中的最大值歸一化；將低帶激勵(lì)信號(hào)的fft系數(shù)乘以歸一化的高帶合成濾波器的沖擊響應(yīng)fft系數(shù)就可以得到頻域的基礎(chǔ)信號(hào)；

(4)提取高低頻對(duì)應(yīng)頻帶之間的增益信息；

計(jì)算288樣點(diǎn)幀準(zhǔn)高頻信號(hào)和原始高頻信號(hào)對(duì)應(yīng)子帶間的能量增益，

(5)利用高頻信號(hào)的譜包絡(luò)信息及增益信息調(diào)整原始低頻信號(hào)生成的高頻激勵(lì)信號(hào)來(lái)重建高頻信號(hào)。

作為本發(fā)明進(jìn)一步方案：所述對(duì)于音樂(lè)信號(hào)，采用基于高低頻信號(hào)相關(guān)性的頻帶復(fù)制帶寬擴(kuò)展方法具體為：

(1)對(duì)原始高低頻信號(hào)進(jìn)行加窗并變換到頻域；

利用重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗對(duì)每一個(gè)256樣點(diǎn)幀的原始高低頻信號(hào)進(jìn)行加窗，得到288樣點(diǎn)幀；對(duì)加窗后的原始信號(hào)和高頻信號(hào)通過(guò)fft變換到頻域；

(2)計(jì)算高低頻信號(hào)對(duì)應(yīng)頻帶之間的相關(guān)性，若相關(guān)性較高，則將低頻信號(hào)復(fù)制到高頻頻段用于高頻重建；若高低頻信號(hào)之間的相關(guān)性較低，則將白噪聲信號(hào)填充到高頻頻段用于高頻重建；

針對(duì)每一個(gè)288樣點(diǎn)幀，計(jì)算對(duì)應(yīng)高低頻信號(hào)之間的相關(guān)性，從而確定用低頻信號(hào)還是白噪聲信號(hào)來(lái)重建；

(3)提取能量參數(shù)；

若采用低頻信號(hào)來(lái)復(fù)制高頻信號(hào)，需提取對(duì)應(yīng)低頻子帶的能量增益；若采用白噪聲重建高頻，則需提取高頻子帶平均能量；

(4)利用能量參數(shù)調(diào)整復(fù)制的低頻信號(hào)或白噪聲信號(hào)完成高頻重建。

一種所述音頻帶寬擴(kuò)展的擴(kuò)展裝置，包括信號(hào)類型檢測(cè)模塊、語(yǔ)音信號(hào)帶寬擴(kuò)展模塊和音樂(lè)信號(hào)帶寬擴(kuò)展模塊，

所述信號(hào)類型檢測(cè)模塊，用于檢測(cè)當(dāng)前幀信號(hào)在混合acelp/tvc核心編碼器中的編碼模式來(lái)區(qū)分信號(hào)類型；

所述語(yǔ)音信號(hào)帶寬擴(kuò)展模塊，用于完成語(yǔ)音幀信號(hào)的高頻重建，

所述音樂(lè)信號(hào)帶寬擴(kuò)展模塊，用于完成音樂(lè)幀信號(hào)的高頻重建。

作為本發(fā)明進(jìn)一步方案：所述語(yǔ)音信號(hào)帶寬擴(kuò)展模塊包括：

低頻殘差提取模塊，提取低頻殘差信號(hào)作為激勵(lì)信號(hào)，低帶原始信號(hào)經(jīng)過(guò)低帶線性預(yù)測(cè)逆濾波器濾波后得到低帶殘差信號(hào)作為激勵(lì)信號(hào)，低帶的線性預(yù)測(cè)系數(shù)每幀更新一次；每一個(gè)1024樣點(diǎn)超幀的低帶激勵(lì)信號(hào)通過(guò)長(zhǎng)度為288樣點(diǎn)，重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗分割為四個(gè)長(zhǎng)度288樣點(diǎn)的幀；

包絡(luò)信息提取模塊，提取高頻lpc系數(shù)，表征高頻包絡(luò)信息，提取高頻lpc系數(shù)，表征高頻包絡(luò)信息，具體為，對(duì)每一幀高頻原始信號(hào)進(jìn)行一次八階線性預(yù)測(cè)分析，得到一組八階的線性預(yù)測(cè)編碼系數(shù)，并轉(zhuǎn)換為導(dǎo)抗頻譜對(duì)系數(shù)，導(dǎo)抗頻譜對(duì)系數(shù)進(jìn)一步變換為導(dǎo)抗譜頻率系數(shù)；量化后的isf系數(shù)變換為量化后線性預(yù)測(cè)系數(shù)，并以此產(chǎn)生高頻合成濾波器；假設(shè)高頻合成濾波器288點(diǎn)的沖擊響應(yīng)為，用288點(diǎn)的快速傅里葉變換將變換到頻域，以此表示原始高頻信號(hào)的頻譜包絡(luò)；

增益提取模塊，提取高頻與準(zhǔn)高頻信號(hào)之間的對(duì)應(yīng)頻帶之間的增益信息，計(jì)算288樣點(diǎn)幀準(zhǔn)高頻信號(hào)和原對(duì)應(yīng)子帶間的能量增益，并進(jìn)行編碼傳遞到解碼端；

重建模塊，用于利用增益信息調(diào)整調(diào)整準(zhǔn)高頻信號(hào)完成高頻重建。

作為本發(fā)明再進(jìn)一步方案：所述音樂(lè)信號(hào)帶寬擴(kuò)展模塊包括：

加窗轉(zhuǎn)換模塊，對(duì)原始高低頻信號(hào)進(jìn)行加窗并變換到頻域，利用重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗對(duì)每一個(gè)256樣點(diǎn)幀的原始高低頻信號(hào)進(jìn)行加窗，得到288樣點(diǎn)幀；對(duì)加窗后的原始信號(hào)和高頻信號(hào)通過(guò)fft變換到頻域；

相關(guān)性計(jì)算模塊，計(jì)算高低頻信號(hào)對(duì)應(yīng)頻帶之間的相關(guān)性，針對(duì)每一個(gè)288樣點(diǎn)幀，計(jì)算對(duì)應(yīng)高低頻信號(hào)之間的相關(guān)性，從而確定用低頻信號(hào)還是白噪聲信號(hào)來(lái)重建；

能量參數(shù)提取模塊，提取指導(dǎo)高頻重建所需的能量參數(shù)，采用低頻信號(hào)來(lái)復(fù)制高頻信號(hào)，需提取對(duì)應(yīng)低頻子帶的能量增益；若采用白噪聲重建高頻，則需提取高頻子帶平均能量；

重建模塊，用于利用能量參數(shù)調(diào)整低頻或白噪聲信號(hào)完成高頻重建。

與現(xiàn)有技術(shù)相比，本發(fā)明的有益效果是：

本發(fā)明充分考慮到了不同信號(hào)類型的特性，從信號(hào)類型的角度著手，通過(guò)檢測(cè)當(dāng)前幀信號(hào)的acelp/tvc編碼模式判斷當(dāng)前幀的信號(hào)類型(語(yǔ)音/音樂(lè))，再基于信號(hào)類型分別對(duì)語(yǔ)音和音樂(lè)信號(hào)進(jìn)行自適應(yīng)的高頻重建策略，以提高音頻恢復(fù)質(zhì)量。因此本發(fā)明實(shí)施例技術(shù)方案能夠更準(zhǔn)確的進(jìn)行高頻重建。

附圖說(shuō)明

圖1是本發(fā)明實(shí)施例帶寬擴(kuò)展的方法流程圖。

圖2是本發(fā)明實(shí)施例語(yǔ)音幀信號(hào)高頻重建策略流程圖。

圖3是本發(fā)明實(shí)施例音樂(lè)幀信號(hào)高頻重建策略流程圖。

圖4是本發(fā)明實(shí)施例帶寬擴(kuò)展的模塊裝置圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。

如圖1所示，是本發(fā)明實(shí)施例的方法流程圖，音頻帶寬擴(kuò)展的方法，包括以下步驟：

步驟101：檢測(cè)當(dāng)前幀信號(hào)在混合acelp/tvc核心編碼器中的編碼模式來(lái)區(qū)分信號(hào)類型，若當(dāng)前幀信號(hào)在核心編碼器的編碼模式為acelp256，則當(dāng)前幀為語(yǔ)音信號(hào)；若當(dāng)前幀信號(hào)在核心編碼器的編碼模式為tvc256、tvc512、tvc1024，則當(dāng)前幀為音樂(lè)信號(hào)；

步驟102：基于信號(hào)類型分別對(duì)語(yǔ)音和音樂(lè)信號(hào)選擇自適應(yīng)的高頻重建策略，若為語(yǔ)音信號(hào)，則采用基于lpc的帶寬擴(kuò)展策略；若為音樂(lè)信號(hào)，則采用基于高低頻信號(hào)相關(guān)性的頻帶復(fù)制帶寬擴(kuò)展策略。

本發(fā)明針對(duì)語(yǔ)音幀信號(hào)和音樂(lè)幀信號(hào)分別采用不同的帶寬擴(kuò)展策略，下面將分別介紹。

如圖2所示，是本發(fā)明實(shí)施例語(yǔ)音幀信號(hào)高頻重建策略流程圖，包括以下步驟：

步驟201，提取低頻殘差信號(hào)作為激勵(lì)信號(hào)，低帶原始信號(hào)經(jīng)過(guò)低帶線性預(yù)測(cè)逆濾波器濾波后得到低帶殘差信號(hào)作為激勵(lì)信號(hào)，低帶的線性預(yù)測(cè)系數(shù)每幀更新一次。每一個(gè)1024樣點(diǎn)超幀的低帶激勵(lì)信號(hào)通過(guò)長(zhǎng)度為288樣點(diǎn)，重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗分割為四個(gè)長(zhǎng)度288樣點(diǎn)的幀。

步驟202，提取高頻lpc系數(shù)表征高頻包絡(luò)信息，對(duì)每一幀高頻原始信號(hào)進(jìn)行一次八階線性預(yù)測(cè)分析，得到一組八階的線性預(yù)測(cè)編碼(lpc)系數(shù)，并轉(zhuǎn)換為導(dǎo)抗頻譜對(duì)(isp)系數(shù)，導(dǎo)抗頻譜對(duì)系數(shù)進(jìn)一步變換為導(dǎo)抗譜頻率(isf)系數(shù)。量化后的isf系數(shù)變換為量化后線性預(yù)測(cè)系數(shù)，并以此產(chǎn)生高頻合成濾波器。假設(shè)高頻合成濾波器288點(diǎn)的沖擊響應(yīng)為，用288點(diǎn)的快速傅里葉變換(fft)將變換到頻域，以此表示原始高頻信號(hào)的頻譜包絡(luò)。

步驟203，利用步驟202得到的高頻包絡(luò)信息和步驟201得到的低頻殘差信號(hào)得到準(zhǔn)高頻信號(hào)，每一幀的低帶激勵(lì)信號(hào)和高帶合成濾波器的沖擊響應(yīng)用288點(diǎn)的fft變換到頻域。高帶合成濾波器沖擊響應(yīng)的288點(diǎn)fft系數(shù)用其中的最大值歸一化。將低帶激勵(lì)信號(hào)的fft系數(shù)乘以歸一化的高帶合成濾波器的沖擊響應(yīng)fft系數(shù)就可以得到頻域的準(zhǔn)高頻信號(hào)。

步驟204，提取增益信息，計(jì)算288樣點(diǎn)幀準(zhǔn)高頻信號(hào)和原始高頻信號(hào)對(duì)應(yīng)子帶間的能量增益。

步驟205，高頻重建，利用步驟204得到的能量增益調(diào)整步驟203得到的準(zhǔn)高頻信號(hào)完成高頻重建。

如圖3所示，是本發(fā)明實(shí)施例音樂(lè)幀信號(hào)高頻重建策略流程圖，包括以下步驟：

步驟301，對(duì)原始高低頻信號(hào)進(jìn)行加窗并變換到頻域，利用重疊區(qū)域?yàn)?2樣點(diǎn)的余弦窗對(duì)每一個(gè)256樣點(diǎn)幀的原始高低頻信號(hào)進(jìn)行加窗，得到288樣點(diǎn)幀。對(duì)加窗后的原始信號(hào)和高頻信號(hào)通過(guò)fft變換到頻域。

步驟302，計(jì)算高低頻信號(hào)對(duì)應(yīng)頻帶之間的相關(guān)性，針對(duì)每一個(gè)288樣點(diǎn)幀，通過(guò)計(jì)算對(duì)應(yīng)高低頻信號(hào)之間的相關(guān)性，從而確定用低頻信號(hào)還是白噪聲信號(hào)來(lái)重建。

步驟303，提取能量參數(shù)，根據(jù)步驟302相關(guān)性計(jì)算判斷的結(jié)果，若采用低頻信號(hào)來(lái)復(fù)制高頻信號(hào)，需提取對(duì)應(yīng)低頻子帶的能量增益。若采用白噪聲重建高頻，則需提取高頻子帶平均能量。

步驟304，高頻重建，利用步驟303得到的能量參數(shù)調(diào)整步驟304得到的激勵(lì)信號(hào)完成高頻重建。

如圖4所示，一種音頻帶寬擴(kuò)展的裝置，包括：信號(hào)類型檢測(cè)模塊401、語(yǔ)音信號(hào)帶寬擴(kuò)展模塊402、音樂(lè)信號(hào)帶寬擴(kuò)展模塊403。

信號(hào)類型檢測(cè)模塊401，用于檢測(cè)當(dāng)前幀信號(hào)在混合acelp/tvc核心編碼器中的編碼模式來(lái)區(qū)分信號(hào)類型。

語(yǔ)音信號(hào)帶寬擴(kuò)展模塊402，用于完成語(yǔ)音幀信號(hào)的高頻重建；

音樂(lè)信號(hào)帶寬擴(kuò)展模塊403，用于完成音樂(lè)幀信號(hào)的高頻重建。

所述語(yǔ)音信號(hào)帶寬擴(kuò)展模塊402，進(jìn)一步包括：低頻殘差提取模塊4021，包絡(luò)信息提取模塊4022，增益提取模塊4023，重建模塊4024。

低頻殘差提取模塊4021，用于提取低頻殘差信號(hào)作為激勵(lì)信號(hào)；

包絡(luò)信息提取模塊4022，用于提取高頻lpc系數(shù)，表征高頻包絡(luò)信息；

增益提取模塊4023，用于提取高頻與準(zhǔn)高頻信號(hào)之間的對(duì)應(yīng)頻帶之間的增益信息；

重建模塊4024，用于利用增益信息調(diào)整調(diào)整準(zhǔn)高頻信號(hào)完成高頻重建。

所述音樂(lè)信號(hào)帶寬擴(kuò)展模塊，進(jìn)一步包括：加窗轉(zhuǎn)換模塊4031，相關(guān)性計(jì)算模塊4032，能量參數(shù)提取模塊4033，重建模塊4034。

加窗轉(zhuǎn)換模塊4031，用于對(duì)原始高低頻信號(hào)進(jìn)行加窗并變換到頻域。

相關(guān)性計(jì)算模塊4032，用于計(jì)算高低頻信號(hào)對(duì)應(yīng)頻帶之間的相關(guān)性。

能量參數(shù)提取模塊4033，用于提取指導(dǎo)高頻重建所需的能量參數(shù)。

重建模塊4034，用于利用能量參數(shù)調(diào)整低頻或白噪聲信號(hào)完成高頻重建。

對(duì)于本領(lǐng)域技術(shù)人員而言，顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié)，而且在不背離本發(fā)明的精神或基本特征的情況下，能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此，無(wú)論從哪一點(diǎn)來(lái)看，均應(yīng)將實(shí)施例看作是示范性的，而且是非限制性的，本發(fā)明的范圍由所附權(quán)利要求而不是上述說(shuō)明限定，因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：胡瑞敏;姜林;文彬;王曉晨;江游
技術(shù)所有人：武漢大學(xué)深圳研究院
我是此專利的發(fā)明人

上一篇：一種地毯展覽設(shè)備的制造方法與工藝
下一篇：一種通用的車輪展示支架的制造方法與工藝

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

音頻信號(hào)帶寬相關(guān)技術(shù)

音頻帶寬相關(guān)技術(shù)

帶寬擴(kuò)展相關(guān)技術(shù)

重新裝載音頻裝置相關(guān)技術(shù)

不停重新裝載音頻裝置相關(guān)技術(shù)

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

一種音頻帶寬擴(kuò)展的方法及擴(kuò)展裝置與流程