日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

對(duì)話生成模型的訓(xùn)練方法、對(duì)話生成方法及裝置與流程

文檔序號(hào):39707019發(fā)布日期:2024-10-22 12:51閱讀:59來源:國知局

本申請(qǐng)實(shí)施例涉及人工智能領(lǐng)域,具體涉及一種對(duì)話生成模型的訓(xùn)練方法、對(duì)話生成方法及裝置。


背景技術(shù):

1、對(duì)話生成是一個(gè)具有挑戰(zhàn)性的問題,因?yàn)樗粌H要求對(duì)話中的上下文進(jìn)行建模,還要求利用上下文生成連貫流暢的語句。

2、現(xiàn)有方案通常分為基于規(guī)則生成和基于神經(jīng)網(wǎng)絡(luò)生成。端到端對(duì)話生成仍然面臨一系列挑戰(zhàn)。首先,語言是復(fù)雜多義的,同一句話可能有多個(gè)不同的解釋,這使得確定正確的生成方式變得復(fù)雜。此外,人類對(duì)話通常是上下文相關(guān)的,對(duì)話系統(tǒng)需要能夠理解之前的對(duì)話歷史以產(chǎn)生有意義的回應(yīng)。這要求模型能夠捕捉長期依賴關(guān)系和上下文信息,這通常需要具備強(qiáng)大的記憶和推理能力。另一個(gè)重要挑戰(zhàn)是情感和情感感知。對(duì)話不僅僅是傳遞信息,還涉及情感表達(dá)和感知。因此,對(duì)話系統(tǒng)需要能夠識(shí)別和生成情感化的語言,以便更好地模擬人際交往。這增加了生成模型的復(fù)雜性,因?yàn)樗鼈儾粌H需要處理語法和語義,還需要處理情感信息。此外,生成模型還面臨數(shù)據(jù)稀缺的問題。大規(guī)模對(duì)話數(shù)據(jù)的收集和標(biāo)注是昂貴和耗時(shí)的過程,這導(dǎo)致了數(shù)據(jù)不足的問題。缺乏足夠的多樣性和質(zhì)量的數(shù)據(jù)可能會(huì)限制模型的性能和泛化能力。


技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)實(shí)施例在于提供一種對(duì)話生成模型的訓(xùn)練方法、對(duì)話生成方法及裝置,解決如何提高對(duì)話模型輸出的準(zhǔn)確性的問題。

2、第一方面,提供一種對(duì)話生成模型的訓(xùn)練方法,包括:

3、獲取用于構(gòu)建對(duì)抗對(duì)話系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)單元;

4、根據(jù)所述網(wǎng)絡(luò)結(jié)構(gòu)單元,確定對(duì)抗訓(xùn)練對(duì)話模型,并對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練,得到訓(xùn)練后的對(duì)抗訓(xùn)練對(duì)話模型,所述對(duì)抗訓(xùn)練對(duì)話模型包括生成器和判別器。

5、可選的,獲取用于構(gòu)建對(duì)抗對(duì)話系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)單元,包括:

6、通過應(yīng)用神經(jīng)架構(gòu)搜索于特定的數(shù)據(jù)集上,獲取用于構(gòu)建對(duì)抗對(duì)話系統(tǒng)最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)單元。

7、可選的,對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練,包括:

8、對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練,獲取所述判別器輸出的指示信息,所述指示信息用于指示所述生成器生成語句的質(zhì)量;

9、通過所述指示信息調(diào)整所述生成器的網(wǎng)絡(luò)參數(shù)。

10、可選的,通過所述指示信息調(diào)整所述生成器的網(wǎng)絡(luò)參數(shù),包括:

11、通過策略梯度算法將所述指示信息發(fā)送給所述生成器,調(diào)整所述生成器的網(wǎng)絡(luò)參數(shù)。

12、可選的,在對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練中,所述判別器的輸入的語句包含當(dāng)前狀態(tài)相關(guān)信息。

13、第二方面,提供一種對(duì)話生成方法,應(yīng)用于運(yùn)行有對(duì)抗訓(xùn)練對(duì)話模型的服務(wù)器中,所述對(duì)話生成模型是第一方面所述方法訓(xùn)練的模型,所述方法包括:

14、獲取對(duì)話的上下文;

15、通過所述對(duì)抗訓(xùn)練對(duì)話模型的生成器,得到與所述對(duì)話的上下文對(duì)應(yīng)的一個(gè)或多個(gè)候選話語;

16、通過所述對(duì)抗訓(xùn)練對(duì)話模型的判別器,獲取每個(gè)候選話語的質(zhì)量;

17、將與所述對(duì)話的上下文匹配,且質(zhì)量最高的候選話語作為目標(biāo)話語。

18、第四方面,提供一種對(duì)話生成模型的訓(xùn)練裝置,包括:

19、第一獲取模塊,用于獲取用于構(gòu)建對(duì)抗對(duì)話系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)單元;

20、訓(xùn)練模塊,用于根據(jù)所述網(wǎng)絡(luò)結(jié)構(gòu)單元,確定對(duì)抗訓(xùn)練對(duì)話模型,并對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練,得到訓(xùn)練后的對(duì)抗訓(xùn)練對(duì)話模型,所述對(duì)抗訓(xùn)練對(duì)話模型包括生成器和判別器。

21、可選的,所述第一獲取模塊進(jìn)一步用于:通過應(yīng)用神經(jīng)架構(gòu)搜索于特定的數(shù)據(jù)集上,獲取用于構(gòu)建對(duì)抗對(duì)話系統(tǒng)最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)單元。

22、可選的,所述訓(xùn)練模塊進(jìn)一步用于:對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練,獲取所述判別器輸出的指示信息,所述指示信息用于指示所述生成器生成語句的質(zhì)量;通過所述指示信息調(diào)整所述生成器的網(wǎng)絡(luò)參數(shù)。

23、可選的,所述訓(xùn)練模塊進(jìn)一步用于:通過策略梯度算法將所述指示信息發(fā)送給所述生成器,調(diào)整所述生成器的網(wǎng)絡(luò)參數(shù)。

24、第四方面,提供一種對(duì)話生成裝置,應(yīng)用于運(yùn)行有對(duì)抗訓(xùn)練對(duì)話模型的服務(wù)器中,所述對(duì)話生成模型是第一方面所述方法訓(xùn)練的模型,所述裝置包括:

25、第二獲取模塊,用于獲取對(duì)話的上下文;

26、第一處理模塊,用于通過所述對(duì)抗訓(xùn)練對(duì)話模型的生成器,得到與所述對(duì)話的上下文對(duì)應(yīng)的一個(gè)或多個(gè)候選話語;

27、第三獲取模塊,用于通過所述對(duì)抗訓(xùn)練對(duì)話模型的判別器,獲取每個(gè)候選話語的質(zhì)量;

28、第二處理模塊,用于將與所述對(duì)話的上下文匹配,且質(zhì)量最高的候選話語作為目標(biāo)話語。

29、第五方面,提供一種電子設(shè)備,其特征在于,包括處理器,存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序或指令,所述程序或指令被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面或第二方面所述的方法的步驟。

30、第六方面,提供一種可讀存儲(chǔ)介質(zhì),其特征在于,所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)程序或指令,所述程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面或第二方面所述的方法的步驟。

31、在本申請(qǐng)實(shí)施例中,獲取用于構(gòu)建對(duì)抗對(duì)話系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)單元;根據(jù)所述網(wǎng)絡(luò)結(jié)構(gòu)單元,確定對(duì)抗訓(xùn)練對(duì)話模型,并對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練,得到訓(xùn)練后的對(duì)抗訓(xùn)練對(duì)話模型,所述對(duì)抗訓(xùn)練對(duì)話模型包括生成器和判別器,結(jié)合神經(jīng)架構(gòu)搜索及對(duì)抗訓(xùn)練,實(shí)現(xiàn)端到端對(duì)話生成到對(duì)話評(píng)估的自動(dòng)閉環(huán),提高對(duì)話模型輸出的準(zhǔn)確性。



技術(shù)特征:

1.一種對(duì)話生成模型的訓(xùn)練方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取用于構(gòu)建對(duì)抗對(duì)話系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)單元,包括:

3.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練,包括:

4.根據(jù)權(quán)利要求3所述的方法,其特征在于,通過所述指示信息調(diào)整所述生成器的網(wǎng)絡(luò)參數(shù),包括:

5.根據(jù)權(quán)利要求3所述的方法,其特征在于,在對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練中,所述判別器的輸入的語句包含當(dāng)前狀態(tài)相關(guān)信息。

6.一種對(duì)話生成方法,其特征在于,應(yīng)用于運(yùn)行有對(duì)抗訓(xùn)練對(duì)話模型的服務(wù)器中,所述對(duì)話生成模型是權(quán)利要求1至5任一所述方法訓(xùn)練的模型,所述方法包括:

7.一種對(duì)話生成模型的訓(xùn)練裝置,其特征在于,包括:

8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第一獲取模塊進(jìn)一步用于:通過應(yīng)用神經(jīng)架構(gòu)搜索于特定的數(shù)據(jù)集上,獲取用于構(gòu)建對(duì)抗對(duì)話系統(tǒng)最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)單元。

9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述訓(xùn)練模塊進(jìn)一步用于:對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練,獲取所述判別器輸出的指示信息,所述指示信息用于指示所述生成器生成語句的質(zhì)量;通過所述指示信息調(diào)整所述生成器的網(wǎng)絡(luò)參數(shù)。

10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述訓(xùn)練模塊進(jìn)一步用于:通過策略梯度算法將所述指示信息發(fā)送給所述生成器,調(diào)整所述生成器的網(wǎng)絡(luò)參數(shù)。

11.一種對(duì)話生成裝置,應(yīng)用于運(yùn)行有對(duì)抗訓(xùn)練對(duì)話模型的服務(wù)器中,所述對(duì)話生成模型是權(quán)利要求1至5任一所述方法訓(xùn)練的模型,所述裝置包括:

12.一種電子設(shè)備,其特征在于,包括處理器,存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序或指令,所述程序或指令被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。

13.一種可讀存儲(chǔ)介質(zhì),其特征在于,所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)程序或指令,所述程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。


技術(shù)總結(jié)
本申請(qǐng)實(shí)施例提供一種對(duì)話生成模型的訓(xùn)練方法、對(duì)話生成方法及裝置,該方法包括:獲取用于構(gòu)建對(duì)抗對(duì)話系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)單元;根據(jù)所述網(wǎng)絡(luò)結(jié)構(gòu)單元,確定對(duì)抗訓(xùn)練對(duì)話模型,并對(duì)所述對(duì)抗訓(xùn)練對(duì)話模型進(jìn)行對(duì)抗訓(xùn)練,得到訓(xùn)練后的對(duì)抗訓(xùn)練對(duì)話模型,所述對(duì)抗訓(xùn)練對(duì)話模型包括生成器和判別器。

技術(shù)研發(fā)人員:黃毅,馮俊蘭
受保護(hù)的技術(shù)使用者:中國移動(dòng)通信有限公司研究院
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1