日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

法語(yǔ)發(fā)音評(píng)價(jià)方法、模型、介質(zhì)及電子設(shè)備

文檔序號(hào):42167827發(fā)布日期:2025-06-13 16:22閱讀:15來(lái)源:國(guó)知局

本發(fā)明涉及語(yǔ)言學(xué)習(xí)和語(yǔ)音,具體而言,涉及一種法語(yǔ)發(fā)音評(píng)價(jià)方法、法語(yǔ)發(fā)音評(píng)價(jià)模型、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及電子設(shè)備。


背景技術(shù):

1、相關(guān)技術(shù)中的法語(yǔ)發(fā)音評(píng)價(jià)方法主要依賴于相似度計(jì)算,其核心原理是計(jì)算朗讀者的語(yǔ)音與標(biāo)準(zhǔn)發(fā)音樣本之間的相似度來(lái)給出評(píng)分。這種方法存在顯著的局限性,即必須擁有相應(yīng)的標(biāo)準(zhǔn)發(fā)音樣本才能進(jìn)行評(píng)價(jià),評(píng)價(jià)效率不高、適用范圍小。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問(wèn)題之一。為此,本發(fā)明提出一種法語(yǔ)發(fā)音評(píng)價(jià)方法,所述法語(yǔ)發(fā)音評(píng)價(jià)方法具有評(píng)價(jià)效率高、適用范圍廣、靈活便捷等優(yōu)點(diǎn)。

2、本發(fā)明還提出一種法語(yǔ)發(fā)音評(píng)價(jià)模型。

3、本發(fā)明還提出一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

4、本發(fā)明還提出一種電子設(shè)備。

5、根據(jù)本發(fā)明第一方面實(shí)施例的法語(yǔ)發(fā)音評(píng)價(jià)方法,包括:

6、s100,構(gòu)建預(yù)訓(xùn)練的標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)、單詞級(jí)分幀網(wǎng)絡(luò)、單詞級(jí)評(píng)分網(wǎng)絡(luò)和句子級(jí)流暢度評(píng)價(jià)算法;所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)用于輸出法語(yǔ)標(biāo)準(zhǔn)音頻,所述單詞級(jí)分幀網(wǎng)絡(luò)用于輸出機(jī)器分幀掩碼段,所述單詞級(jí)評(píng)分網(wǎng)絡(luò)用于輸出單詞級(jí)評(píng)分值,所述句子級(jí)流暢度評(píng)價(jià)算法用于輸出句子評(píng)分值;

7、s200,構(gòu)建標(biāo)準(zhǔn)語(yǔ)言數(shù)據(jù)集、分幀訓(xùn)練數(shù)據(jù)集和分級(jí)制評(píng)分訓(xùn)練數(shù)據(jù)集;所述標(biāo)準(zhǔn)語(yǔ)言數(shù)據(jù)集包括法語(yǔ)朗讀音頻,所述法語(yǔ)朗讀音頻由具有標(biāo)準(zhǔn)法語(yǔ)發(fā)音的朗讀者朗讀而成;所述分幀訓(xùn)練數(shù)據(jù)集用于訓(xùn)練所述單詞級(jí)分幀網(wǎng)絡(luò)且包括所述法語(yǔ)朗讀音頻、法語(yǔ)朗讀文本和人工分幀掩碼段,所述人工分幀掩碼段根據(jù)法語(yǔ)連音和聯(lián)誦特點(diǎn)人工標(biāo)注而成;所述分級(jí)制評(píng)分訓(xùn)練數(shù)據(jù)集包括所述法語(yǔ)標(biāo)準(zhǔn)音頻、所述法語(yǔ)朗讀音頻和數(shù)據(jù)標(biāo)簽,所述數(shù)據(jù)標(biāo)簽根據(jù)所述朗讀者在法語(yǔ)學(xué)習(xí)階段的分級(jí)標(biāo)注生成;

8、s300,利用生成對(duì)抗方式訓(xùn)練所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò),包括以下步驟:

9、s310,構(gòu)建真?zhèn)闻袆e網(wǎng)絡(luò),所述真?zhèn)闻袆e網(wǎng)絡(luò)具有判別輸入音頻是人工朗讀或機(jī)器生成的功能;

10、s320,訓(xùn)練所述真?zhèn)闻袆e網(wǎng)絡(luò),包括以下步驟:

11、s321,向所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)輸入所述法語(yǔ)朗讀文本,以使所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)生成機(jī)器語(yǔ)音頻譜數(shù)據(jù)集;

12、s322,將所述機(jī)器語(yǔ)音頻譜數(shù)據(jù)集與所述標(biāo)準(zhǔn)語(yǔ)言數(shù)據(jù)集集成為真?zhèn)闻袆e訓(xùn)練集,并為所述真?zhèn)闻袆e訓(xùn)練集打上真?zhèn)螛?biāo)簽;

13、s323,向所述真?zhèn)闻袆e網(wǎng)絡(luò)輸入所述真?zhèn)闻袆e訓(xùn)練集以使所述真?zhèn)闻袆e網(wǎng)絡(luò)生成預(yù)測(cè)值;

14、s324,計(jì)算所述預(yù)測(cè)值與所述真?zhèn)螛?biāo)簽的差異值,并以所述差異值的最小化為優(yōu)化

15、目標(biāo),對(duì)所述真?zhèn)闻袆e網(wǎng)絡(luò)的參數(shù)進(jìn)行動(dòng)態(tài)更新;

16、s330,訓(xùn)練所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò),包括以下步驟:

17、s331,執(zhí)行步驟s321-s323;

18、s332,計(jì)算所述預(yù)測(cè)值與所述真?zhèn)螛?biāo)簽的差異值,并以所述差異值的最大化為優(yōu)化

19、目標(biāo),對(duì)所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)的參數(shù)進(jìn)行動(dòng)態(tài)更新;

20、s340,執(zhí)行步驟s320-s330,當(dāng)滿足第一預(yù)設(shè)條件時(shí)輸出所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)的訓(xùn)練參數(shù);

21、s400,訓(xùn)練所述單詞級(jí)分幀網(wǎng)絡(luò),包括以下步驟:

22、s410,向所述單詞級(jí)分幀網(wǎng)絡(luò)輸入所述法語(yǔ)朗讀文本以及所述法語(yǔ)朗讀音頻和所述法語(yǔ)標(biāo)準(zhǔn)音頻二者中的一個(gè),以使所述單詞級(jí)分幀網(wǎng)絡(luò)輸出所述機(jī)器分幀掩碼段;

23、s420,根據(jù)所述人工分幀掩碼段與所述機(jī)器分幀掩碼段計(jì)算分幀損失值;

24、s430,根據(jù)所述分幀損失值更新所述單詞級(jí)分幀網(wǎng)絡(luò)的參數(shù);

25、s440,執(zhí)行步驟s410-s430,當(dāng)滿足第二預(yù)設(shè)條件時(shí)輸出所述單詞級(jí)分幀網(wǎng)絡(luò)的訓(xùn)練參數(shù);

26、s500,訓(xùn)練所述單詞級(jí)評(píng)分網(wǎng)絡(luò),包括以下步驟:

27、s510,向所述單詞級(jí)分幀網(wǎng)絡(luò)分別輸入所述法語(yǔ)標(biāo)準(zhǔn)音頻以生成標(biāo)準(zhǔn)單詞級(jí)分幀、輸入所述法語(yǔ)朗讀音頻以生成朗讀單詞級(jí)分幀;

28、s520,向所述單詞級(jí)評(píng)分網(wǎng)絡(luò)輸入所述標(biāo)準(zhǔn)單詞級(jí)分幀和所述朗讀單詞級(jí)分幀,以使所述單詞級(jí)評(píng)分網(wǎng)絡(luò)輸出訓(xùn)練評(píng)分值;

29、s530,根據(jù)所述訓(xùn)練評(píng)分值和所述數(shù)據(jù)標(biāo)簽計(jì)算分級(jí)損失值;

30、s540,根據(jù)所述分級(jí)損失值更新所述單詞級(jí)評(píng)分網(wǎng)絡(luò)的參數(shù);

31、s550,執(zhí)行步驟s510-s540,當(dāng)滿足第三預(yù)設(shè)條件時(shí)輸出所述單詞級(jí)評(píng)分網(wǎng)絡(luò)的訓(xùn)練參數(shù);

32、s600,對(duì)待評(píng)價(jià)者的法語(yǔ)發(fā)音進(jìn)行評(píng)價(jià),包括以下步驟:

33、s610,向所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)輸入所述待評(píng)價(jià)者的發(fā)音文本,以輸出所述法語(yǔ)標(biāo)準(zhǔn)音頻;

34、s620,向所述單詞級(jí)分幀網(wǎng)絡(luò)輸入待評(píng)價(jià)音頻以輸出待評(píng)價(jià)單詞級(jí)分幀、輸入所述法語(yǔ)標(biāo)準(zhǔn)音頻以輸出所述標(biāo)準(zhǔn)單詞級(jí)分幀;

35、s630,根據(jù)所述待評(píng)價(jià)單詞級(jí)分幀和所述標(biāo)準(zhǔn)單詞級(jí)分幀,所述單詞級(jí)評(píng)分網(wǎng)絡(luò)輸出單詞級(jí)評(píng)分值;

36、s640,計(jì)算所有所述單詞級(jí)評(píng)分值的均值;

37、s650,計(jì)算所述待評(píng)價(jià)音頻的句子級(jí)流暢度;

38、s660,根據(jù)所述句子級(jí)流暢度和所述均值計(jì)算最終評(píng)價(jià)值。

39、根據(jù)本發(fā)明實(shí)施例的法語(yǔ)發(fā)音評(píng)價(jià)方法,能夠僅根據(jù)待評(píng)價(jià)者的語(yǔ)音音頻及其對(duì)應(yīng)的發(fā)音文本,自動(dòng)對(duì)其發(fā)音進(jìn)行評(píng)價(jià),無(wú)需依賴標(biāo)準(zhǔn)發(fā)音樣本進(jìn)行對(duì)比。由此,不僅提高了評(píng)價(jià)效率,也擴(kuò)大了評(píng)價(jià)方法的適用范圍,使其更加靈活和便捷。

40、另外,根據(jù)本發(fā)明實(shí)施例的法語(yǔ)發(fā)音評(píng)價(jià)方法還具有如下附加的技術(shù)特征:

41、根據(jù)本發(fā)明的一些實(shí)施例,訓(xùn)練所述單詞級(jí)分幀網(wǎng)絡(luò)還包括:

42、通過(guò)對(duì)所述法語(yǔ)標(biāo)準(zhǔn)音頻執(zhí)行短時(shí)傅里葉變換獲取所述法語(yǔ)標(biāo)準(zhǔn)音頻的時(shí)頻譜;

43、根據(jù)所述法語(yǔ)朗讀文本、所述法語(yǔ)標(biāo)準(zhǔn)音頻的時(shí)頻譜生成所述機(jī)器分幀掩碼段,以將所述法語(yǔ)標(biāo)準(zhǔn)音頻的時(shí)頻譜切分為分幀標(biāo)準(zhǔn)時(shí)頻譜。

44、根據(jù)本發(fā)明的一些實(shí)施例,訓(xùn)練所述單詞級(jí)分幀網(wǎng)絡(luò)還包括:

45、通過(guò)對(duì)所述法語(yǔ)朗讀音頻執(zhí)行短時(shí)傅里葉變換獲取所述法語(yǔ)朗讀音頻的時(shí)頻譜;

46、根據(jù)所述法語(yǔ)朗讀文本、所述法語(yǔ)朗讀音頻的時(shí)頻譜生成所述機(jī)器分幀掩碼段,以將所述法語(yǔ)朗讀音頻的時(shí)頻譜切分為分幀朗讀時(shí)頻譜。

47、根據(jù)本發(fā)明的一些實(shí)施例,訓(xùn)練所述單詞級(jí)評(píng)分網(wǎng)絡(luò)還包括:

48、分別對(duì)所述標(biāo)準(zhǔn)單詞級(jí)分幀和所述朗讀單詞級(jí)分幀進(jìn)行特征提取,輸出標(biāo)準(zhǔn)特征向量和朗讀特征向量;

49、根據(jù)所述標(biāo)準(zhǔn)特征向量和所述朗讀特征向量計(jì)算所述訓(xùn)練評(píng)分值。

50、根據(jù)本發(fā)明的一些實(shí)施例,對(duì)所述分級(jí)制評(píng)分訓(xùn)練數(shù)據(jù)集設(shè)置所述數(shù)據(jù)標(biāo)簽包括:

51、將母語(yǔ)為法語(yǔ)的朗讀者提供的朗讀錄音設(shè)置為一級(jí);

52、將母語(yǔ)為非法語(yǔ)且具有高級(jí)法語(yǔ)學(xué)習(xí)背景的朗讀者提供的朗讀錄音設(shè)置為二級(jí);

53、將接受過(guò)短期培訓(xùn)的非法語(yǔ)母語(yǔ)者提供的朗讀錄音設(shè)置為三級(jí);

54、將未經(jīng)系統(tǒng)訓(xùn)練、僅通過(guò)模仿發(fā)音的朗讀者提供的朗讀錄音設(shè)置為四級(jí);

55、將出現(xiàn)明顯錯(cuò)誤的發(fā)音實(shí)例設(shè)置為五級(jí);

56、將包含白噪音或其他非目標(biāo)聲音的錄音設(shè)置為六級(jí)。

57、根據(jù)本發(fā)明第二方面實(shí)施例的法語(yǔ)發(fā)音評(píng)價(jià)模型,包括:第一構(gòu)建模塊,所述第一構(gòu)建模塊用于構(gòu)建預(yù)訓(xùn)練的標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)、單詞級(jí)分幀網(wǎng)絡(luò)、單詞級(jí)評(píng)分網(wǎng)絡(luò)和句子級(jí)流暢度評(píng)價(jià)算法;所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)用于輸出法語(yǔ)標(biāo)準(zhǔn)音頻,所述單詞級(jí)分幀網(wǎng)絡(luò)用于輸出機(jī)器分幀掩碼段,所述單詞級(jí)評(píng)分網(wǎng)絡(luò)用于輸出單詞級(jí)評(píng)分值,所述句子級(jí)流暢度評(píng)價(jià)算法用于輸出句子評(píng)分值;第二構(gòu)建模塊,所述第二構(gòu)建模塊用于構(gòu)建標(biāo)準(zhǔn)語(yǔ)言數(shù)據(jù)集、分幀訓(xùn)練數(shù)據(jù)集和分級(jí)制評(píng)分訓(xùn)練數(shù)據(jù)集;所述標(biāo)準(zhǔn)語(yǔ)言數(shù)據(jù)集包括法語(yǔ)朗讀音頻,所述法語(yǔ)朗讀音頻由具有標(biāo)準(zhǔn)法語(yǔ)發(fā)音的朗讀者朗讀而成;所述分幀訓(xùn)練數(shù)據(jù)集用于訓(xùn)練所述單詞級(jí)分幀網(wǎng)絡(luò)且包括所述法語(yǔ)朗讀音頻、法語(yǔ)朗讀文本和人工分幀掩碼段,所述人工分幀掩碼段根據(jù)法語(yǔ)連音和聯(lián)誦特點(diǎn)人工標(biāo)注而成;所述分級(jí)制評(píng)分訓(xùn)練數(shù)據(jù)集包括所述法語(yǔ)標(biāo)準(zhǔn)音頻、所述法語(yǔ)朗讀音頻和數(shù)據(jù)標(biāo)簽,所述數(shù)據(jù)標(biāo)簽根據(jù)所述朗讀者在法語(yǔ)學(xué)習(xí)階段的分級(jí)標(biāo)注生成;真?zhèn)斡?xùn)練模塊,所述真?zhèn)斡?xùn)練模塊利用生成對(duì)抗方式訓(xùn)練所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)且包括:真?zhèn)螛?gòu)建層,所述真?zhèn)螛?gòu)建層用于構(gòu)建真?zhèn)闻袆e網(wǎng)絡(luò),所述真?zhèn)闻袆e網(wǎng)絡(luò)具有判別輸入音頻是人工朗讀或機(jī)器生成的功能;真?zhèn)斡?xùn)練層,所述真?zhèn)斡?xùn)練層用于訓(xùn)練所述真?zhèn)闻袆e網(wǎng)絡(luò)且包括:真?zhèn)屋斎雽?,所述真?zhèn)屋斎雽佑糜谙蛩鰳?biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)輸入所述法語(yǔ)朗讀文本,以使所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)生成機(jī)器語(yǔ)音頻譜數(shù)據(jù)集;用于向所述真?zhèn)闻袆e網(wǎng)絡(luò)輸入真?zhèn)闻袆e訓(xùn)練集以使所述真?zhèn)闻袆e網(wǎng)絡(luò)生成預(yù)測(cè)值,所述真?zhèn)闻袆e訓(xùn)練集包括所述機(jī)器語(yǔ)音頻譜數(shù)據(jù)集與所述標(biāo)準(zhǔn)語(yǔ)言數(shù)據(jù)集,所述真?zhèn)闻袆e訓(xùn)練集具有真?zhèn)螛?biāo)簽;真?zhèn)蝺?yōu)化器,所述真?zhèn)蝺?yōu)化器用于計(jì)算所述預(yù)測(cè)值與所述真?zhèn)螛?biāo)簽的差異值,并以所述差異值的最小化為優(yōu)化目標(biāo),對(duì)所述真?zhèn)闻袆e網(wǎng)絡(luò)的參數(shù)進(jìn)行動(dòng)態(tài)更新;標(biāo)準(zhǔn)訓(xùn)練模塊,所述標(biāo)準(zhǔn)訓(xùn)練模塊用于訓(xùn)練所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)且包括:標(biāo)準(zhǔn)計(jì)算層,所述標(biāo)準(zhǔn)計(jì)算層用于計(jì)算所述預(yù)測(cè)值與所述真?zhèn)螛?biāo)簽的差異值,所述真?zhèn)蝺?yōu)化器以所述差異值的最大化為優(yōu)化目標(biāo),對(duì)所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)的參數(shù)進(jìn)行動(dòng)態(tài)更新;標(biāo)準(zhǔn)輸出層,所述標(biāo)準(zhǔn)輸出層當(dāng)滿足第一預(yù)設(shè)條件時(shí)輸出所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)的訓(xùn)練參數(shù);分幀訓(xùn)練模塊,所述分幀訓(xùn)練模塊用于訓(xùn)練所述單詞級(jí)分幀網(wǎng)絡(luò)且包括:分幀輸入層,所述分幀輸入層用于向所述單詞級(jí)分幀網(wǎng)絡(luò)輸入所述法語(yǔ)朗讀文本以及所述法語(yǔ)朗讀音頻和所述法語(yǔ)標(biāo)準(zhǔn)音頻二者中的一個(gè),以使所述單詞級(jí)分幀網(wǎng)絡(luò)輸出所述機(jī)器分幀掩碼段;分幀損失層,所述分幀損失層根據(jù)所述人工分幀掩碼段與所述機(jī)器分幀掩碼段計(jì)算分幀損失值;分幀優(yōu)化器,所述分幀優(yōu)化器根據(jù)所述分幀損失值更新所述單詞級(jí)分幀網(wǎng)絡(luò)的參數(shù);分幀輸出層,所述分幀輸出層當(dāng)滿足第二預(yù)設(shè)條件時(shí)輸出所述單詞級(jí)分幀網(wǎng)絡(luò)的訓(xùn)練參數(shù);評(píng)分訓(xùn)練模塊,所述評(píng)分訓(xùn)練模塊用于訓(xùn)練所述單詞級(jí)評(píng)分網(wǎng)絡(luò)且包括:評(píng)分輸入層,所述評(píng)分輸入層用于向所述單詞級(jí)分幀網(wǎng)絡(luò)分別輸入所述法語(yǔ)標(biāo)準(zhǔn)音頻以生成標(biāo)準(zhǔn)單詞級(jí)分幀、輸入所述法語(yǔ)朗讀音頻以生成朗讀單詞級(jí)分幀;還用于向所述單詞級(jí)評(píng)分網(wǎng)絡(luò)輸入所述標(biāo)準(zhǔn)單詞級(jí)分幀和所述朗讀單詞級(jí)分幀,以使所述單詞級(jí)評(píng)分網(wǎng)絡(luò)輸出訓(xùn)練評(píng)分值;評(píng)分損失層,所述評(píng)分損失層根據(jù)所述訓(xùn)練評(píng)分值和所述數(shù)據(jù)標(biāo)簽計(jì)算分級(jí)損失值;評(píng)分優(yōu)化器,所述評(píng)分優(yōu)化器根據(jù)所述分級(jí)損失值更新所述單詞級(jí)評(píng)分網(wǎng)絡(luò)的參數(shù);評(píng)分輸出層,所述評(píng)分輸出層當(dāng)滿足第三預(yù)設(shè)條件時(shí)輸出所述單詞級(jí)評(píng)分網(wǎng)絡(luò)的訓(xùn)練參數(shù);評(píng)價(jià)模塊,所述評(píng)價(jià)模塊用于對(duì)待評(píng)價(jià)者的法語(yǔ)發(fā)音進(jìn)行評(píng)價(jià)且包括:評(píng)價(jià)輸入層,所述評(píng)價(jià)輸入層用于向所述標(biāo)準(zhǔn)語(yǔ)音生成網(wǎng)絡(luò)輸入所述待評(píng)價(jià)者的發(fā)音文本,以輸出所述法語(yǔ)標(biāo)準(zhǔn)音頻;用于向所述單詞級(jí)分幀網(wǎng)絡(luò)輸入待評(píng)價(jià)音頻以輸出待評(píng)價(jià)單詞級(jí)分幀、輸入所述法語(yǔ)標(biāo)準(zhǔn)音頻以輸出所述標(biāo)準(zhǔn)單詞級(jí)分幀;還用于向所述單詞級(jí)評(píng)分網(wǎng)絡(luò)輸入所述待評(píng)價(jià)單詞級(jí)分幀和所述標(biāo)準(zhǔn)單詞級(jí)分幀,以使所述單詞級(jí)評(píng)分網(wǎng)絡(luò)輸出單詞級(jí)評(píng)分值;評(píng)價(jià)計(jì)算層,所述評(píng)價(jià)計(jì)算層計(jì)算所有所述單詞級(jí)評(píng)分值的均值,并計(jì)算所述待評(píng)價(jià)音頻的句子級(jí)流暢度,根據(jù)所述句子級(jí)流暢度和所述均值計(jì)算最終評(píng)價(jià)值。

58、根據(jù)本發(fā)明實(shí)施例的法語(yǔ)發(fā)音評(píng)價(jià)模型,能夠僅根據(jù)待評(píng)價(jià)者的語(yǔ)音音頻及其對(duì)應(yīng)的發(fā)音文本,自動(dòng)對(duì)其發(fā)音進(jìn)行評(píng)價(jià),無(wú)需依賴標(biāo)準(zhǔn)發(fā)音樣本進(jìn)行對(duì)比。由此,不僅提高了評(píng)價(jià)效率,也擴(kuò)大了評(píng)價(jià)方法的適用范圍,使其更加靈活和便捷。

59、另外,根據(jù)本發(fā)明實(shí)施例的法語(yǔ)發(fā)音評(píng)價(jià)模型還具有如下附加的技術(shù)特征:

60、根據(jù)本發(fā)明的一些實(shí)施例,所述分幀訓(xùn)練模塊還包括:變換層,所述變換層用于對(duì)所述法語(yǔ)標(biāo)準(zhǔn)音頻執(zhí)行短時(shí)傅里葉變換以獲取所述法語(yǔ)標(biāo)準(zhǔn)音頻的時(shí)頻譜或?qū)λ龇ㄕZ(yǔ)朗讀音頻執(zhí)行短時(shí)傅里葉變換以獲取所述法語(yǔ)朗讀音頻的時(shí)頻譜,所述單詞級(jí)分幀網(wǎng)絡(luò)根據(jù)所述法語(yǔ)朗讀文本、所述法語(yǔ)標(biāo)準(zhǔn)音頻的時(shí)頻譜生成所述機(jī)器分幀掩碼段,以將所述法語(yǔ)標(biāo)準(zhǔn)音頻的時(shí)頻譜切分為分幀標(biāo)準(zhǔn)時(shí)頻譜,或根據(jù)所述法語(yǔ)朗讀文本、所述法語(yǔ)朗讀音頻的時(shí)頻譜生成所述機(jī)器分幀掩碼段,以將所述法語(yǔ)朗讀音頻的時(shí)頻譜切分為分幀朗讀時(shí)頻譜。

61、根據(jù)本發(fā)明的一些實(shí)施例,所述評(píng)分訓(xùn)練模塊還包括:特征提取層,所述特征提取層分別對(duì)所述標(biāo)準(zhǔn)單詞級(jí)分幀和所述朗讀單詞級(jí)分幀進(jìn)行特征提取,并輸出標(biāo)準(zhǔn)特征向量和朗讀特征向量,所述單詞級(jí)評(píng)分網(wǎng)絡(luò)根據(jù)所述標(biāo)準(zhǔn)特征向量和所述朗讀特征向量計(jì)算所述訓(xùn)練評(píng)分值。

62、根據(jù)本發(fā)明第三方面實(shí)施例的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本發(fā)明第一方面實(shí)施例所述的法語(yǔ)發(fā)音評(píng)價(jià)方法。

63、根據(jù)本發(fā)明實(shí)施例的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),能夠僅根據(jù)待評(píng)價(jià)者的語(yǔ)音音頻及其對(duì)應(yīng)的發(fā)音文本,自動(dòng)對(duì)其發(fā)音進(jìn)行評(píng)價(jià),無(wú)需依賴標(biāo)準(zhǔn)發(fā)音樣本進(jìn)行對(duì)比。由此,不僅提高了評(píng)價(jià)效率,也擴(kuò)大了評(píng)價(jià)方法的適用范圍,使其更加靈活和便捷。

64、根據(jù)本發(fā)明第四方面實(shí)施例的電子設(shè)備,所述電子設(shè)備包括處理器和存儲(chǔ)器,所述處理器和所述存儲(chǔ)器相連,所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如本發(fā)明第一方面實(shí)施例所述的法語(yǔ)發(fā)音評(píng)價(jià)方法。

65、根據(jù)本發(fā)明實(shí)施例的電子設(shè)備,能夠僅根據(jù)待評(píng)價(jià)者的語(yǔ)音音頻及其對(duì)應(yīng)的發(fā)音文本,自動(dòng)對(duì)其發(fā)音進(jìn)行評(píng)價(jià),無(wú)需依賴標(biāo)準(zhǔn)發(fā)音樣本進(jìn)行對(duì)比。由此,不僅提高了評(píng)價(jià)效率,也擴(kuò)大了評(píng)價(jià)方法的適用范圍,使其更加靈活和便捷。

66、本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1