本申請(qǐng)涉及音頻處理技術(shù),尤其涉及一種音頻編解碼處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、目前,在音視頻碼流的編解碼過(guò)程中,通常需要根據(jù)不同的傳輸/存儲(chǔ)情況,配置多種壓縮碼率,以便于在條件好的情況下使用碼率較高的壓縮算法,在條件不好的情況下使用碼率較低的壓縮算法。
2、而且,基于深度學(xué)習(xí)的壓縮算法均是采用不同碼率重新訓(xùn)練的方法,即根據(jù)一種碼率設(shè)計(jì)并訓(xùn)練一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò),有幾種碼率就需要訓(xùn)練幾種深度學(xué)習(xí)網(wǎng)絡(luò)。
3、由此可見(jiàn),相關(guān)技術(shù)中存在采用不同壓縮碼率的壓縮算法,對(duì)音頻碼流進(jìn)行編解碼的技術(shù)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)?zhí)峁┮环N音頻編解碼處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),用以解決相關(guān)技術(shù)中需要采用不同壓縮碼率的壓縮算法,對(duì)音頻碼流進(jìn)行編解碼的技術(shù)問(wèn)題,實(shí)現(xiàn)基于深度學(xué)習(xí)進(jìn)行殘差再編碼的方式,對(duì)音頻碼流進(jìn)行編解碼的技術(shù)效果。
2、一方面,本申請(qǐng)?zhí)峁┮环N音頻編解碼處理方法,所述方法包括:
3、獲取多級(jí)編解碼網(wǎng)絡(luò)中的每一級(jí)編解碼網(wǎng)絡(luò)的輸入信號(hào)與解碼信號(hào);
4、根據(jù)每一級(jí)所述編解碼網(wǎng)絡(luò)的輸入信號(hào)與解碼信號(hào),確定每一級(jí)所述編解碼網(wǎng)絡(luò)的殘差信號(hào);
5、將每一級(jí)所述編解碼網(wǎng)絡(luò)的殘差信號(hào)作為下一級(jí)編解碼網(wǎng)絡(luò)的輸入信號(hào)以進(jìn)行再次編碼,得到所述多級(jí)編解碼網(wǎng)絡(luò)的多級(jí)編碼碼流;
6、分別采用所述多級(jí)編解碼網(wǎng)絡(luò)中的每一級(jí)解碼器網(wǎng)絡(luò)對(duì)所述多級(jí)編碼碼流中與所述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)編碼碼流進(jìn)行解碼處理,并將得到的所述每一級(jí)解碼器網(wǎng)絡(luò)的每一級(jí)解碼碼流進(jìn)行相加,得到所述多級(jí)編解碼網(wǎng)絡(luò)的解碼碼流。
7、一種可選的實(shí)施方式,將每一級(jí)所述編解碼網(wǎng)絡(luò)的殘差信號(hào)作為下一級(jí)編解碼網(wǎng)絡(luò)的輸入信號(hào)以進(jìn)行再次編碼,得到所述多級(jí)編解碼網(wǎng)絡(luò)的多級(jí)編碼碼流,包括:
8、采用所述下一級(jí)編解碼網(wǎng)絡(luò)對(duì)所述殘差信號(hào)進(jìn)行降維處理,得到所述下一級(jí)編解碼網(wǎng)絡(luò)的多維向量;
9、采用所述多級(jí)編解碼網(wǎng)絡(luò)中的量化網(wǎng)絡(luò),檢索碼表中與所述多維向量對(duì)應(yīng)的碼字,以使得在后續(xù)處理中采用所述碼字的索引值替代所述多維向量,以得到所述多級(jí)編解碼網(wǎng)絡(luò)的多級(jí)編碼碼流。
10、一種可選的實(shí)施方式,將所述多級(jí)編碼碼流中與所述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)編碼碼流進(jìn)行解碼處理,得到所述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)解碼碼流,包括:
11、采用所述多級(jí)編解碼網(wǎng)絡(luò)中的反量化網(wǎng)絡(luò),根據(jù)所述碼字的索引值從所述碼表檢索到對(duì)應(yīng)的所述多維向量;
12、采用所述多級(jí)編解碼網(wǎng)絡(luò)中的多級(jí)解碼器網(wǎng)絡(luò),對(duì)所述多級(jí)編碼碼流中與所述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)編碼碼流進(jìn)行解碼處理,以使得各自對(duì)所述多維向量進(jìn)行升維處理,得到所述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)解碼碼流。
13、一種可選的實(shí)施方式,在采用所述多級(jí)編解碼網(wǎng)絡(luò)中的量化網(wǎng)絡(luò),檢索碼表中與所述多維向量對(duì)應(yīng)的碼字之前,所述方法還包括:
14、若所述多維向量與所述量化網(wǎng)絡(luò)的碼表張量不匹配,則采用所述多級(jí)編解碼網(wǎng)絡(luò)中的映射網(wǎng)絡(luò),將所述多維向量處理為與所述量化網(wǎng)絡(luò)的碼表張量匹配。
15、另一方面,本申請(qǐng)?zhí)峁┮环N音頻編解碼處理裝置,所述裝置包括:
16、獲取模塊,用于獲取多級(jí)編解碼網(wǎng)絡(luò)中的每一級(jí)編解碼網(wǎng)絡(luò)的輸入信號(hào)與解碼信號(hào);
17、確定模塊,用于根據(jù)每一級(jí)所述編解碼網(wǎng)絡(luò)的輸入信號(hào)與解碼信號(hào),確定每一級(jí)所述編解碼網(wǎng)絡(luò)的殘差信號(hào);
18、編碼處理模塊,用于將每一級(jí)所述編解碼網(wǎng)絡(luò)的殘差信號(hào)作為下一級(jí)編解碼網(wǎng)絡(luò)的輸入信號(hào)以進(jìn)行再次編碼,得到所述多級(jí)編解碼網(wǎng)絡(luò)的多級(jí)編碼碼流;
19、解碼處理模塊,用于分別采用所述多級(jí)編解碼網(wǎng)絡(luò)中的每一級(jí)解碼器網(wǎng)絡(luò)對(duì)所述多級(jí)編碼碼流中與所述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)編碼碼流進(jìn)行解碼處理,并將得到的所述每一級(jí)解碼器網(wǎng)絡(luò)的每一級(jí)解碼碼流進(jìn)行相加,得到所述多級(jí)編解碼網(wǎng)絡(luò)的解碼碼流。
20、一種可選的實(shí)施方式,所述編碼處理模塊,包括:
21、第一處理單元,用于采用所述下一級(jí)編解碼網(wǎng)絡(luò)對(duì)所述殘差信號(hào)進(jìn)行降維處理,得到所述下一級(jí)編解碼網(wǎng)絡(luò)的多維向量;
22、第二處理單元,用于采用所述多級(jí)編解碼網(wǎng)絡(luò)中的量化網(wǎng)絡(luò),檢索碼表中與所述多維向量對(duì)應(yīng)的碼字,以使得在后續(xù)處理中采用所述碼字的索引值替代所述多維向量,以得到所述多級(jí)編解碼網(wǎng)絡(luò)的多級(jí)編碼碼流。
23、一種可選的實(shí)施方式,所述解碼處理模塊,包括:
24、第三處理單元,用于采用所述多級(jí)編解碼網(wǎng)絡(luò)中的反量化網(wǎng)絡(luò),根據(jù)所述碼字的索引值從所述碼表檢索到對(duì)應(yīng)的所述多維向量;
25、第四處理單元,用于采用所述多級(jí)編解碼網(wǎng)絡(luò)中的多級(jí)解碼器網(wǎng)絡(luò),對(duì)所述多級(jí)編碼碼流中與所述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)編碼碼流進(jìn)行解碼處理,以使得各自對(duì)所述多維向量進(jìn)行升維處理,得到所述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)解碼碼流。
26、另一方面,本申請(qǐng)?zhí)峁┮环N電子設(shè)備,包括:處理器,以及與上述處理器連接的存儲(chǔ)器;上述存儲(chǔ)器存儲(chǔ)計(jì)算機(jī)執(zhí)行指令;上述處理器執(zhí)行上述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)執(zhí)行指令,以實(shí)現(xiàn)如任一項(xiàng)上述的方法。
27、另一方面,本申請(qǐng)?zhí)峁┮环N計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),上述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)執(zhí)行指令,上述計(jì)算機(jī)執(zhí)行指令被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如任一項(xiàng)上述的方法。
28、另一方面,本申請(qǐng)?zhí)峁┮环N計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)任一項(xiàng)上述的方法。
29、本申請(qǐng)?zhí)峁┑囊纛l編解碼處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),通過(guò)獲取多級(jí)編解碼網(wǎng)絡(luò)中的每一級(jí)編解碼網(wǎng)絡(luò)的輸入信號(hào)與解碼信號(hào);根據(jù)每一級(jí)上述編解碼網(wǎng)絡(luò)的輸入信號(hào)與解碼信號(hào),確定每一級(jí)上述編解碼網(wǎng)絡(luò)的殘差信號(hào);將每一級(jí)上述編解碼網(wǎng)絡(luò)的殘差信號(hào)作為下一級(jí)編解碼網(wǎng)絡(luò)的輸入信號(hào)以進(jìn)行再次編碼,得到上述多級(jí)編解碼網(wǎng)絡(luò)的多級(jí)編碼碼流;分別采用上述多級(jí)編解碼網(wǎng)絡(luò)中的每一級(jí)解碼器網(wǎng)絡(luò)對(duì)上述多級(jí)編碼碼流中與上述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)編碼碼流進(jìn)行解碼處理,并將得到的上述每一級(jí)解碼器網(wǎng)絡(luò)的每一級(jí)解碼碼流進(jìn)行相加,得到上述多級(jí)編解碼網(wǎng)絡(luò)的解碼碼流??梢越鉀Q相關(guān)技術(shù)中需要采用不同壓縮碼率的壓縮算法,對(duì)音頻碼流進(jìn)行編解碼的技術(shù)問(wèn)題,實(shí)現(xiàn)基于深度學(xué)習(xí)進(jìn)行殘差再編碼的方式,對(duì)音頻碼流進(jìn)行編解碼的技術(shù)效果。
1.一種音頻編解碼處理方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將每一級(jí)所述編解碼網(wǎng)絡(luò)的殘差信號(hào)作為下一級(jí)編解碼網(wǎng)絡(luò)的輸入信號(hào)以進(jìn)行再次編碼,得到所述多級(jí)編解碼網(wǎng)絡(luò)的多級(jí)編碼碼流,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述多級(jí)編碼碼流中與所述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)編碼碼流進(jìn)行解碼處理,得到所述每一級(jí)解碼器網(wǎng)絡(luò)各自對(duì)應(yīng)的每一級(jí)解碼碼流,包括:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,在采用所述多級(jí)編解碼網(wǎng)絡(luò)中的量化網(wǎng)絡(luò),檢索碼表中與所述多維向量對(duì)應(yīng)的碼字之前,所述方法還包括:
5.一種音頻編解碼處理裝置,其特征在于,所述裝置包括:
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述編碼處理模塊,包括:
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述解碼處理模塊,包括:
8.一種電子設(shè)備,其特征在于,包括:處理器,以及與所述處理器連接的存儲(chǔ)器;
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)執(zhí)行指令,所述計(jì)算機(jī)執(zhí)行指令被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如權(quán)利要求1至4中任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至4中任一項(xiàng)所述的方法。