模型優(yōu)化方法、裝置、計(jì)算平臺(tái)及計(jì)算機(jī)存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：42026664發(fā)布日期：2025-05-30 17:10閱讀：5來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本申請(qǐng)涉及網(wǎng)絡(luò)模型，尤其涉及一種模型優(yōu)化方法、裝置、計(jì)算平臺(tái)及計(jì)算機(jī)存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、點(diǎn)擊率(click?through?rate，簡(jiǎn)稱ctr)預(yù)測(cè)是通過(guò)估計(jì)用戶點(diǎn)擊候選物品的概率，在推薦、檢索和廣告等服務(wù)的應(yīng)用場(chǎng)景中，點(diǎn)擊率的預(yù)測(cè)操作是一項(xiàng)基礎(chǔ)任務(wù)。預(yù)測(cè)ctr的精確性不僅對(duì)用戶參與度有顯著影響，還對(duì)工業(yè)企業(yè)的效益產(chǎn)生重大影響。

2、其中，點(diǎn)擊率的預(yù)測(cè)操作可以通過(guò)網(wǎng)絡(luò)模型來(lái)實(shí)現(xiàn)，這使得點(diǎn)擊率預(yù)測(cè)的效果與網(wǎng)絡(luò)模型的推理精確度息息相關(guān)。為了能夠提升網(wǎng)絡(luò)模型的推理能力，需要不斷地對(duì)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化訓(xùn)練。目前，往往會(huì)通過(guò)構(gòu)建好的損失函數(shù)來(lái)對(duì)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化訓(xùn)練操作，由于損失函數(shù)的實(shí)現(xiàn)方式較為單一和固定，進(jìn)而無(wú)法保證對(duì)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化操作的質(zhì)量和效果。

技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)的多個(gè)方面提供一種模型優(yōu)化方法、裝置、計(jì)算平臺(tái)及計(jì)算機(jī)存儲(chǔ)介質(zhì)，能夠在一定程度上保證模型優(yōu)化操作的質(zhì)量和效果。

2、第一方面，本發(fā)明實(shí)施例提供了一種模型優(yōu)化方法，包括：

3、獲取用于實(shí)現(xiàn)點(diǎn)擊率的預(yù)測(cè)操作的待優(yōu)化模型，其中，所述待優(yōu)化模型包括至少兩個(gè)不同的子模型，所述子模型用于點(diǎn)擊率預(yù)測(cè)，且任意兩個(gè)子模型針對(duì)同一樣本數(shù)據(jù)的擬合能力不同；

4、基于任意兩個(gè)不同的子模型，確定交叉熵?fù)p失函數(shù)，其中，所述交叉熵?fù)p失函數(shù)用于指導(dǎo)兩個(gè)不同的子模型中的一子模型的學(xué)習(xí)訓(xùn)練操作；

5、基于所述交叉熵?fù)p失函數(shù)對(duì)所述待優(yōu)化模型進(jìn)行優(yōu)化，獲得優(yōu)化后模型。

6、第二方面，本發(fā)明實(shí)施例提供了一種模型優(yōu)化裝置，包括：

7、第一獲取模塊，用于獲取用于實(shí)現(xiàn)點(diǎn)擊率的預(yù)測(cè)操作的待優(yōu)化模型，其中，所述待優(yōu)化模型包括至少兩個(gè)不同的子模型，所述子模型用于點(diǎn)擊率預(yù)測(cè)，且任意兩個(gè)子模型針對(duì)同一樣本數(shù)據(jù)的擬合能力不同；

8、第一確定模塊，用于基于任意兩個(gè)不同的子模型，確定交叉熵?fù)p失函數(shù)，其中，所述交叉熵?fù)p失函數(shù)用于指導(dǎo)兩個(gè)不同的子模型中的一子模型的學(xué)習(xí)訓(xùn)練操作；

9、第一處理模塊，用于基于所述交叉熵?fù)p失函數(shù)對(duì)所述待優(yōu)化模型進(jìn)行優(yōu)化，獲得優(yōu)化后模型。

10、第三方面，本發(fā)明實(shí)施例提供了一種計(jì)算平臺(tái)，包括：存儲(chǔ)器、處理器；其中，所述存儲(chǔ)器用于存儲(chǔ)一條或多條計(jì)算機(jī)指令，其中，所述一條或多條計(jì)算機(jī)指令被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面中所述的模型優(yōu)化方法。

11、第四方面，本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)存儲(chǔ)介質(zhì)儲(chǔ)存有計(jì)算機(jī)程序，其中，在所述計(jì)算機(jī)程序運(yùn)行時(shí)控制所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行如第一方面中所述的模型優(yōu)化方法。

12、第五方面，本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品，包括計(jì)算機(jī)程序，當(dāng)所述計(jì)算機(jī)程序被計(jì)算平臺(tái)的處理器執(zhí)行時(shí)，使所述處理器執(zhí)行上述第一方面中所述的模型優(yōu)化方法中的步驟。

13、本實(shí)施例提供的模型優(yōu)化方法、裝置、計(jì)算平臺(tái)及計(jì)算機(jī)存儲(chǔ)介質(zhì)，通過(guò)獲取用于實(shí)現(xiàn)點(diǎn)擊率預(yù)測(cè)操作的待優(yōu)化模型，其中，待優(yōu)化模型至少包括兩個(gè)不同的能夠單獨(dú)實(shí)現(xiàn)點(diǎn)擊率預(yù)測(cè)操作的子模型，而后基于待優(yōu)化模型中所包括的任意兩個(gè)不同的子模型來(lái)確定交叉熵?fù)p失函數(shù)，由于兩個(gè)不同的子模型針對(duì)同一組樣本數(shù)據(jù)的擬合能力不同，這種差異性使得所構(gòu)建的交叉熵?fù)p失函數(shù)能夠指導(dǎo)兩個(gè)不同的子模型中的一子模型進(jìn)行學(xué)習(xí)訓(xùn)練操作，并且，由于交叉熵?fù)p函數(shù)與待優(yōu)化模型中的任意兩個(gè)子模型相對(duì)應(yīng)，不同的子模型之間所確定的交叉熵?fù)p失函數(shù)不同，即說(shuō)明交叉熵?fù)p失函數(shù)是基于待優(yōu)化模型所包括的子模型的變化而進(jìn)行靈活變化的，尤其是在待優(yōu)化模型包括多個(gè)子模型的場(chǎng)景中，待優(yōu)化模型所對(duì)應(yīng)的交叉熵?fù)p失函數(shù)的數(shù)量可以為多個(gè)，這樣在基于交叉熵?fù)p失函數(shù)來(lái)對(duì)待優(yōu)化模型進(jìn)行優(yōu)化訓(xùn)練，能夠在一定程度上保證模型優(yōu)化訓(xùn)練的質(zhì)量和效果，進(jìn)而保證了所獲得的優(yōu)化后模型進(jìn)行點(diǎn)擊率預(yù)測(cè)操作的精確度，并在一定程度上提高了該方法的實(shí)用性。

技術(shù)特征：

1.一種模型優(yōu)化方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述至少兩個(gè)不同的子模型至少包括第一子模型和第二子模型；基于任意兩個(gè)不同的子模型，確定交叉熵?fù)p失函數(shù)，包括：

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，確定所述第一子模型的第一類型和所述第二子模型的第二類型，包括：

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，分別基于所述第一損失函數(shù)值和所述第二損失函數(shù)值，確定所述第一類型和所述第二類型，包括：

5.根據(jù)權(quán)利要求2所述的方法，其特征在于，基于所述第一類型、第二類型、第一子模型和所述第二子模型，確定所述交叉熵?fù)p失函數(shù)，包括：

6.根據(jù)權(quán)利要求5所述的方法，其特征在于，基于所述第一類型、第二類型、第一預(yù)測(cè)概率值和所述第二預(yù)測(cè)概率值，確定所述交叉熵?fù)p失函數(shù)，包括：

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，基于所述樣本數(shù)量、停止梯度參數(shù)、第一類型、第二類型、第一預(yù)測(cè)概率值和所述第二預(yù)測(cè)概率值，確定所述交叉熵?fù)p失函數(shù)，包括：

8.根據(jù)權(quán)利要求7所述的方法，其特征在于，所述交叉熵?fù)p失函數(shù)與所述分支損失函數(shù)呈負(fù)相關(guān)，所述交叉熵?fù)p失函數(shù)與所述樣本數(shù)量呈正相關(guān)。

9.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述待優(yōu)化模型還包括與至少兩個(gè)不同的子模型相對(duì)應(yīng)的融合子模型，所述融合子模型用于通過(guò)融合特征進(jìn)行點(diǎn)擊率的預(yù)測(cè)操作，其中，所述融合特征通過(guò)對(duì)各個(gè)子模型所輸出的隱空間特征進(jìn)行融合操作所獲得；

10.根據(jù)權(quán)利要求9所述的方法，其特征在于，其中，所述第一隱空間特征與所述第二隱空間特征之間滿足正交變換；基于所述第一隱空間特征和所述第二隱空間特征，確定與任意兩個(gè)子模型相對(duì)應(yīng)的差異性損失函數(shù)，包括：

11.根據(jù)權(quán)利要求10所述的方法，其特征在于，所述差異性損失函數(shù)與所述數(shù)量呈負(fù)相關(guān)，所述差異性損失函數(shù)與所述正交變換矩陣呈正相關(guān)。

12.根據(jù)權(quán)利要求9所述的方法，其特征在于，基于所述差異性損失函數(shù)和所述交叉熵?fù)p失函數(shù)對(duì)所述待優(yōu)化模型進(jìn)行優(yōu)化，獲得優(yōu)化后模型，包括：

13.根據(jù)權(quán)利要求12所述的方法，其特征在于，基于所述差異性損失函數(shù)、所述交叉熵?fù)p失函數(shù)、分支損失函數(shù)以及所述融合分支損失函數(shù)，確定目標(biāo)損失函數(shù)，包括：

14.根據(jù)權(quán)利要求13所述的方法，其特征在于，基于所述預(yù)估損失函數(shù)、所述差異性損失函數(shù)以及所述交叉熵?fù)p失函數(shù)，確定所述目標(biāo)損失函數(shù)，包括：

15.根據(jù)權(quán)利要求9-14中任意一項(xiàng)所述的方法，其特征在于，在獲得優(yōu)化后模型之后，所述方法還包括：

16.一種模型優(yōu)化裝置，其特征在于，包括：

17.一種計(jì)算平臺(tái)，其特征在于，包括：存儲(chǔ)器、處理器；其中，所述存儲(chǔ)器用于存儲(chǔ)一條或多條計(jì)算機(jī)指令，其中，所述一條或多條計(jì)算機(jī)指令被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)上述權(quán)利要求1-15中任意一項(xiàng)的方法。

18.一種計(jì)算機(jī)存儲(chǔ)介質(zhì)，其特征在于，所述計(jì)算機(jī)存儲(chǔ)介質(zhì)儲(chǔ)存有計(jì)算機(jī)程序，其中，在所述計(jì)算機(jī)程序運(yùn)行時(shí)控制所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行上述權(quán)利要求1-15中任意一項(xiàng)的方法。

19.一種計(jì)算機(jī)程序產(chǎn)品，其特征在于，包括：計(jì)算機(jī)程序，當(dāng)所述計(jì)算機(jī)程序被計(jì)算平臺(tái)的處理器執(zhí)行時(shí)，使所述處理器執(zhí)行上述權(quán)利要求1-15中任意一項(xiàng)的方法中的步驟。

技術(shù)總結(jié)
本申請(qǐng)實(shí)施例提供一種模型優(yōu)化方法、裝置、計(jì)算平臺(tái)和計(jì)算機(jī)存儲(chǔ)介質(zhì)，方法包括：獲取用于實(shí)現(xiàn)點(diǎn)擊率預(yù)測(cè)操作的待優(yōu)化模型，該模型由至少兩個(gè)不同的子模型組成，各子模型針對(duì)相同樣本數(shù)據(jù)具有不同的擬合能力；基于任意兩個(gè)不同的子模型，確定交叉熵?fù)p失函數(shù)；該損失函數(shù)用于指導(dǎo)兩個(gè)子模型中的一個(gè)進(jìn)行學(xué)習(xí)和訓(xùn)練，從而充分利用不同子模型之間的互補(bǔ)特性，提升模型整體的預(yù)測(cè)能力；基于確定的交叉熵?fù)p失函數(shù)對(duì)待優(yōu)化模型進(jìn)行優(yōu)化，獲得優(yōu)化后的模型。在本申請(qǐng)實(shí)施例中，由于子模型針對(duì)同一組樣本數(shù)據(jù)的擬合能力不同，這樣在基于由任意兩個(gè)不同的子模型所確定的交叉熵?fù)p失函數(shù)來(lái)進(jìn)行模型優(yōu)化訓(xùn)練，能夠在一定程度上保證模型優(yōu)化訓(xùn)練的質(zhì)量和效果。

技術(shù)研發(fā)人員：陳旭,成子達(dá),肖帥,蘭金松
受保護(hù)的技術(shù)使用者：淘寶（中國(guó)）軟件有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/5/29

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳旭,成子達(dá),肖帥,蘭金松
技術(shù)所有人：淘寶（中國(guó)）軟件有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

模型優(yōu)化方法、裝置、計(jì)算平臺(tái)及計(jì)算機(jī)存儲(chǔ)介質(zhì)與流程

模型優(yōu)化方法、裝置、計(jì)算平臺(tái)及計(jì)算機(jī)存儲(chǔ)介質(zhì)與流程