音頻場(chǎng)景裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及用于處理音頻信號(hào)以使得能夠使用舒適音頻信號(hào)屏蔽背景噪聲的影 響的裝置。本發(fā)明還涉及但不限于用于處理音頻信號(hào)以使得能夠在移動(dòng)設(shè)備處使用舒適音 頻信號(hào)屏蔽背景噪聲的影響的裝置。
【背景技術(shù)】
[0002] 在常規(guī)情形中,環(huán)境包括具有在所有三個(gè)空間維度中傳播的音頻源的聲場(chǎng)。由大 腦控制的人類聽覺系統(tǒng)已經(jīng)進(jìn)化了定位、隔離和理解三維聲場(chǎng)中的這些聲音的先天能力。 例如,當(dāng)來自音頻源的音頻波陣面到達(dá)我們的雙耳時(shí),大腦試圖通過對(duì)嵌入在音頻波陣面 中的線索解碼來確定音頻源的位置。對(duì)空間感知負(fù)責(zé)的兩個(gè)最重要的線索是耳間時(shí)間差 (ITD)以及耳間水平差(ILD)。例如,位于傾聽者左前方的音頻源與左耳相比需要更多時(shí)間 到達(dá)右耳。這一時(shí)間上的差異稱為ITD。類似地,由于頭部遮擋,到達(dá)右耳的波陣面比到達(dá) 左耳的波陣面得到更多衰減,從而產(chǎn)生ILD。另外,由于耳廓結(jié)構(gòu)、肩部反射而產(chǎn)生的波陣 面的變形在如何在3D聲場(chǎng)中定位源方面也扮演著很重要的角色。這些線索因此取決于個(gè) 人/傾聽者、頻率、音頻源在3D聲場(chǎng)中的位置以及他/她所在的環(huán)境(例如傾聽者是否位 于消聲室/禮堂/起居室內(nèi))。
[0003] 經(jīng)3D定位和具體化的音頻聲場(chǎng)已經(jīng)成為事實(shí)上的自然傾聽方式。
[0004] 電話并且特別是無線電話在實(shí)施方式中眾所周知。通話通常在環(huán)境嘈雜的情況下 進(jìn)行,其中背景噪聲造成理解另一方的通信內(nèi)容上的困難。這通常產(chǎn)生請(qǐng)求重復(fù)另一方所 說的內(nèi)容或者停止交流直到噪聲已消失或者用戶已離開噪聲源。這在多方通話(諸如電話 會(huì)議)中尤其嚴(yán)重,其中一個(gè)或兩個(gè)參與者由于本地噪聲而不能跟上討論,從而造成嚴(yán)重 的注意力分散以及不必要地延長(zhǎng)通話持續(xù)時(shí)間。即使周圍或環(huán)境噪聲沒有阻止用戶理解另 一方與其通信的內(nèi)容,防止用戶完全專注于另一方所說的內(nèi)容并且在傾聽時(shí)需要額外的努 力,可能仍然非常分散注意力和煩人。
[0005] 然而,完全抑制或壓制環(huán)境或現(xiàn)場(chǎng)噪聲是不可能的,因?yàn)槠淇梢蕴峁┚o急情況的 指示或者比電話呼叫需要更多用戶注意力的情況。因此,現(xiàn)場(chǎng)噪聲消除能夠?qū)⒂脩襞c其周 圍環(huán)境不必要地隔離。這在緊急情況發(fā)生在傾聽者附近的情形下可能是危險(xiǎn)的,因?yàn)檫@可 能阻止傾聽者聽到來自環(huán)境的警告信號(hào)。
【發(fā)明內(nèi)容】
[0006] 本申請(qǐng)的各方面因此提供另外的或舒適的音頻信號(hào),其基本上被配置成屏蔽背景 或周圍現(xiàn)場(chǎng)音頻場(chǎng)噪聲信號(hào)的影響。
[0007] 根據(jù)第一方面,提供了一種裝置,其包括至少一個(gè)處理器以及至少一個(gè)存儲(chǔ)器,至 少一個(gè)存儲(chǔ)器包括用于一個(gè)或多個(gè)程序的計(jì)算機(jī)代碼,至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)代碼被配 置成與至少一個(gè)處理器一起使得裝置:分析第一音頻信號(hào)以確定至少一個(gè)音頻源,其中第 一音頻信號(hào)從裝置的環(huán)境中的聲場(chǎng)被生成;生成至少一個(gè)另外的音頻源;以及將至少一個(gè) 音頻源和至少一個(gè)另外的音頻源混頻,使得至少一個(gè)另外的音頻源與至少一個(gè)音頻源相關(guān) 聯(lián)。
[0008] 裝置還可以被使得分析第二音頻信號(hào)以確定至少一個(gè)音頻源;并且其中將至少一 個(gè)音頻源和至少一個(gè)另外的音頻源混頻還使得裝置將至少一個(gè)音頻源與至少一個(gè)音頻源 以及至少一個(gè)另外的音頻源混頻。
[0009] 第二音頻信號(hào)可以是以下各項(xiàng)中的至少一項(xiàng):經(jīng)由接收器的所接收的音頻信號(hào); 以及經(jīng)由存儲(chǔ)器的所取回的音頻信號(hào)。
[0010] 生成至少一個(gè)另外的音頻源可以使得裝置生成與至少一個(gè)音頻源相關(guān)聯(lián)的至少 一個(gè)音頻源。
[0011] 生成與至少一個(gè)音頻源相關(guān)聯(lián)的至少一個(gè)另外的音頻源可以使得裝置:從一系列 另外的音頻源類型選擇和/或生成最接近地匹配至少一個(gè)音頻源的至少一個(gè)另外的音頻 源;將另外的音頻源定位在匹配至少一個(gè)音頻源的虛擬位置的虛擬位置處;以及處理另外 的音頻源以匹配至少一個(gè)音頻源的頻譜和/或時(shí)間。
[0012] 與至少一個(gè)音頻源相關(guān)聯(lián)的至少一個(gè)另外的音頻源可以是以下各項(xiàng)中的至少一 項(xiàng):至少一個(gè)另外的音頻源基本上屏蔽至少一個(gè)音頻源;至少一個(gè)另外的音頻源基本上掩 飾至少一個(gè)音頻源;至少一個(gè)另外的音頻源基本上包含至少一個(gè)音頻源;至少一個(gè)另外的 音頻源基本上適應(yīng)至少一個(gè)音頻源;以及至少一個(gè)另外的音頻源基本上偽裝至少一個(gè)音頻 源。
[0013] 分析第一音頻信號(hào)以確定至少一個(gè)音頻源可以使得裝置:確定至少一個(gè)音頻源位 置;確定至少一個(gè)音頻源頻譜;確定至少一個(gè)音頻源時(shí)間。
[0014] 分析第一音頻信號(hào)以確定至少一個(gè)音頻源可以使得裝置:確定至少兩個(gè)音頻源; 確定至少兩個(gè)音頻源的能量參數(shù)值;基于能量參數(shù)值,從至少兩個(gè)音頻源選擇至少一個(gè)音 頻源。
[0015] 分析第一音頻信號(hào)以確定至少一個(gè)音頻源,其中第一音頻信號(hào)從裝置的音頻環(huán)境 被生成,可以使得裝置執(zhí)行以下操作:將第二音頻信號(hào)劃分成第一數(shù)目的頻帶;針對(duì)第一 數(shù)目的頻帶,確定第二數(shù)目的主導(dǎo)音頻方向;以及選擇其中其相關(guān)聯(lián)的音頻分量大于所確 定的噪聲門限值的主導(dǎo)音頻方向作為音頻源的方向。
[0016] 裝置還可以被使得執(zhí)行從至少兩個(gè)麥克風(fēng)接收第二音頻信號(hào),其中麥克風(fēng)位于裝 置上或者鄰近裝置。
[0017] 裝置還可以被使得執(zhí)行接收與至少一個(gè)音頻源相關(guān)聯(lián)的至少一個(gè)用戶輸入,其中 生成至少一個(gè)另外的音頻源,其中至少一個(gè)另外的音頻源與至少一個(gè)音頻相關(guān)聯(lián),使得裝 置基于至少一個(gè)用戶輸入來生成至少一個(gè)另外的音頻源。
[0018] 接收與至少一個(gè)被確定位置的音頻源相關(guān)聯(lián)的至少一個(gè)用戶輸入可以使得裝置 執(zhí)行以下各項(xiàng)中的至少一項(xiàng):接收指示一系列另外的音頻源類型的至少一個(gè)用戶輸入;接 收指示音頻源位置的至少一個(gè)用戶輸入;以及接收指示用于一系列另外的音頻源類型的源 的至少一個(gè)用戶輸入。
[0019] 根據(jù)第二方面,提供了一種裝置,其包括:用于分析第一音頻信號(hào)以確定至少一個(gè) 音頻源的部件,其中第一音頻信號(hào)從裝置的環(huán)境中的聲場(chǎng)被生成;用于生成至少一個(gè)另外 的音頻源的部件;以及用于將至少一個(gè)音頻源和至少一個(gè)另外的音頻源混頻以使得至少一 個(gè)另外的音頻源與至少一個(gè)音頻源相關(guān)聯(lián)的部件。
[0020] 裝置還可以包括用于分析第二音頻信號(hào)以確定至少一個(gè)音頻源的部件;并且其中 將至少一個(gè)音頻源和至少一個(gè)另外的音頻源混頻的部件還可以包括用于將至少一個(gè)音頻 源與至少一個(gè)音頻源以及至少一個(gè)另外的音頻源混頻的部件。
[0021] 第二音頻信號(hào)可以是以下各項(xiàng)中的至少一項(xiàng):經(jīng)由接收器的所接收的音頻信號(hào); 以及經(jīng)由存儲(chǔ)器的所取回的音頻信號(hào)。
[0022] 用于生成至少一個(gè)另外的音頻源的部件可以包括用于生成與至少一個(gè)音頻源相 關(guān)聯(lián)的至少一個(gè)音頻源的部件。
[0023] 用于生成與至少一個(gè)音頻源相關(guān)聯(lián)的至少一個(gè)另外的音頻源的部件可以包括:用 于從一系列另外的音頻源類型選擇和/或生成最接近地匹配至少一個(gè)音頻源的至少一個(gè) 另外的音頻源的部件;用于將另外的音頻源定位在匹配至少一個(gè)音頻源的虛擬位置的虛擬 位置處的部件;以及用于處理另外的音頻源以匹配至少一個(gè)音頻源的頻譜和/或時(shí)間的部 件。
[0024] 與至少一個(gè)音頻源相關(guān)聯(lián)的至少一個(gè)另外的音頻源是以下各項(xiàng)中的至少一項(xiàng):至 少一個(gè)另外的音頻源基本上屏蔽至少一個(gè)音頻源;至少一個(gè)另外的音頻源基本上掩飾至少 一個(gè)音頻源;至少一個(gè)另外的音頻源基本上包含至少一個(gè)音頻源;至少一個(gè)另外的音頻源 基本上適應(yīng)至少一個(gè)音頻源;以及至少一個(gè)另外的音頻源基本上偽裝至少一個(gè)音頻源。
[0025] 用于分析第一音頻信號(hào)以確定至少一個(gè)音頻源的部件可以包括:用于確定至少一 個(gè)音頻源位置的部件;用于確定至少一個(gè)音頻源頻譜的部件;以及用于確定至少一個(gè)音頻 源時(shí)間的部件。
[0026] 用于分析第一音頻信號(hào)以確定至少一個(gè)音頻源的部件可以包括:用于確定至少兩 個(gè)音頻源的部件;用于確定至少兩個(gè)音頻源的能量參數(shù)值的部件;以及用于基于能量參數(shù) 值從至少兩個(gè)音頻源選擇至少一個(gè)音頻源的部件。
[0027] 用于分析第一音頻信號(hào)以確定至少一個(gè)音頻源的部件,其中第一音頻信號(hào)從裝置 的音頻環(huán)境被生成,可以包括:用于將第二音頻信號(hào)劃分成第一數(shù)目的頻帶的部件;用于 針對(duì)第一數(shù)目的頻帶確定第二數(shù)目的主導(dǎo)音頻方向的部件;以及用于選擇其中其相關(guān)聯(lián)的 音頻分量大于所確定的噪聲門限值的主導(dǎo)音頻方向作為音頻源的方向的部件。
[0028] 裝置還可以包括用于從至少兩個(gè)麥克風(fēng)接收第二音頻信號(hào)的部件,其中麥克風(fēng)位 于裝置上或者鄰近裝置。
[0029] 裝置可以包括用于接收與至少一個(gè)音頻源相關(guān)聯(lián)的至少一個(gè)用戶輸入的部件,其 中用于生成至少一個(gè)另外的音頻源的部件,其中至少一個(gè)另外的音頻源與至少一個(gè)音頻相 關(guān)聯(lián),可以包括用于基于至少一個(gè)用戶輸入來生成至少一個(gè)另外的音頻源的部件。
[0030] 用于接收與至少一個(gè)被確定位置的音頻源相關(guān)聯(lián)的至少一個(gè)用戶輸入的部件可 以包括以下各項(xiàng)中的至少一項(xiàng):用于接收指示一系列另外的音頻源類型的至少一個(gè)用戶輸 入的部件;用于接收指示音頻源位置的至少一個(gè)用戶輸入的部件;以及用于接收指示用于 一系列另外的音頻源類型的源的至少一個(gè)用戶輸入的部件。
[0031] 根據(jù)第三方面,提供了一種方法,其包括:分析第一音頻信號(hào)以確定至少一個(gè)音頻 源,其中第一音頻信號(hào)從裝置的環(huán)境中的聲場(chǎng)被生成;生成至少一個(gè)另外的音頻源;以及 將至少一個(gè)音頻源和至少一個(gè)另外的音頻源混頻,使得至少一個(gè)另外的音頻源與至少一個(gè) 首頻源相關(guān)聯(lián)。
[0032] 方法還可以包括分析第二音頻信號(hào)以確定至少一個(gè)音頻源;并且其中將至少一個(gè) 音頻源和至少一個(gè)另外的音頻源混頻還可以包括將至少一個(gè)音頻源與至少一個(gè)音頻源以 及至少一個(gè)另外的音頻源混頻。
[0033] 第二音頻信號(hào)可以是以下各項(xiàng)中的至少一項(xiàng):經(jīng)由接收器的所接收的音頻信號(hào); 以及經(jīng)由存儲(chǔ)器的所取回的音頻信號(hào)。
[0034] 生成至少一個(gè)另外的音頻源可以包括生成與至少一個(gè)音頻源相關(guān)聯(lián)的至少一個(gè) 音頻源。
[0035] 生成與至少一個(gè)音頻源相關(guān)聯(lián)的至少一個(gè)另外的音頻源可以包括:從一系列另外 的音頻源類型選擇和/或生成最接近地匹配至少一個(gè)音頻源的至少一個(gè)另外的音頻源;將 另外的音頻源定位在匹配至少一個(gè)音頻源的虛擬位置的虛擬位置處;以及處理另外的音頻 源以匹配至少一個(gè)音頻源的頻譜和/或時(shí)間。
[0036] 與至少一個(gè)音頻源相關(guān)聯(lián)的至少一個(gè)另外的音頻源可以是以下各項(xiàng)中的至少一 項(xiàng):至少一個(gè)另外的音頻源基本上屏蔽至少一個(gè)音頻源;至少一個(gè)另外的音頻源基本上掩 飾至少一個(gè)音頻源;至少一個(gè)另外的音頻源基本上包含至少一個(gè)音頻源;至少一個(gè)另外的 音頻源基本上適應(yīng)至少一個(gè)音頻源;以及至少一個(gè)另外的音頻源基本上偽裝至少一個(gè)音頻 源。
[0037] 分析第一音頻信號(hào)以確定至少一個(gè)音頻源可以包括:確定至少一個(gè)音頻源位置; 確定至少一個(gè)音頻源頻譜;以及確定至少一個(gè)音頻源時(shí)間。
[0038] 分析第一音頻信號(hào)以確定至少一個(gè)音頻源可以包括:確定至少兩個(gè)音頻源;確定 至少兩個(gè)音頻源的能量參數(shù)值;以及基于能量參數(shù)值,從至少兩個(gè)音頻源選擇至少一個(gè)音 頻源。
[0039] 分析第一音頻信號(hào)以確定至少一個(gè)音頻源,其中第一音頻信號(hào)從裝置的音頻環(huán)境 被生成,可以包括:將第二音頻信號(hào)劃分成第一數(shù)目的頻帶;針對(duì)第一數(shù)目的頻帶,確定第 二數(shù)目的主導(dǎo)音頻方向;以及選擇其中其相關(guān)聯(lián)的音頻分量大于所確定的噪聲門限值的主 導(dǎo)音頻方向作為音頻源的方向。
[0040] 方法還可以包括從至少兩個(gè)麥克風(fēng)接收第二音頻信號(hào),其中麥克風(fēng)位于裝置上或 者鄰近裝置。
[0041] 方法可以包括接收與至少一個(gè)音頻源相關(guān)聯(lián)的至少一個(gè)用戶輸入,其中生成至少 一個(gè)另外的音頻源,其中至少一個(gè)另外的音頻源與至少一個(gè)音頻相關(guān)聯(lián),可以包括基于至 少一個(gè)用戶輸入來生成至少一個(gè)另外的音頻源。
[0042] 接收與至少一個(gè)被確定位置的音頻源相關(guān)聯(lián)的至少一個(gè)用戶輸入可以包括以下 各項(xiàng)中的至少一項(xiàng):接收指示一系列另外的音頻源類型的至少一個(gè)用戶輸入;接收指示音 頻源位置的至少一個(gè)用戶輸入;接收指示用于一系列另外的音頻源類型的源的至少一個(gè)用 戶輸入。
[0043] 根據(jù)第四方面,提供了一種裝置,其包括:音頻檢測(cè)器,被配置成分析第一音頻信 號(hào)以確定至少一個(gè)音頻源,其中第一音頻信號(hào)從裝置的環(huán)境中的聲場(chǎng)被生成;音頻生成器, 被配置成生成至少一個(gè)另外的音頻源;以及混頻器,被配置成將至少一個(gè)音頻源和至少一 個(gè)另外的音頻源混頻以使得至少一個(gè)另外的音頻源與至少一個(gè)音頻源相關(guān)聯(lián)。
[0044] 裝置還可以包括被配置成分析第二音