本發(fā)明涉及圖像生成,特別涉及一種實現(xiàn)高質(zhì)量模特穿衣的方法、裝置、設(shè)備和介質(zhì)。
背景技術(shù):
::1、在現(xiàn)有深度學(xué)習(xí)網(wǎng)絡(luò)技術(shù)方案中,由于模型架構(gòu)設(shè)計和訓(xùn)練方法的局限性,存在以下不足:2、一、生成模型對服裝細節(jié)特征的捕捉和重建能力不足,導(dǎo)致布料紋理、褶皺等細節(jié)模糊或失真;3、二、對服裝材質(zhì)和光照建模不夠精確,造成色彩還原度差、色差大;4、三、缺乏對服裝結(jié)構(gòu)和人體姿態(tài)的深入理解,使得生成的穿著效果不夠自然;5、四、訓(xùn)練數(shù)據(jù)質(zhì)量參差不齊且數(shù)量有限,影響了模型的泛化性能。6、上述的這些問題嚴重制約了深度學(xué)習(xí)在模特穿衣領(lǐng)域的實際應(yīng)用效果。技術(shù)實現(xiàn)思路1、本發(fā)明要解決的技術(shù)問題,在于提供一種實現(xiàn)高質(zhì)量模特穿衣的方法、裝置、設(shè)備和介質(zhì),實現(xiàn)針對不同模特的高質(zhì)量生成式服飾穿衣效果。2、第一方面,本發(fā)明提供了一種實現(xiàn)高質(zhì)量模特穿衣的方法,包括下述步驟:3、步驟1、在服裝圖片庫中,通過quality_filter函數(shù)篩選圖像;通過blur_detection剔除設(shè)定模糊度的圖像;通過lighting_analysis評估光照的均勻性,刪除其中不符合均勻條件的圖像,得到圖像數(shù)據(jù);最終篩選得到設(shè)定數(shù)量的圖像,作為訓(xùn)練數(shù)據(jù);并獲取訓(xùn)練數(shù)據(jù)對應(yīng)的模特展示圖,作為目標數(shù)據(jù);4、步驟2、通過基于swin-unet架構(gòu)的特征提取器和現(xiàn)有的算法將訓(xùn)練數(shù)據(jù)中的圖像進行特征向量的提取,并進行融合,得到衣服特征向量;5、步驟3、將所述衣服特征向量以及對應(yīng)的目標數(shù)據(jù)輸入至擴散模型中,進行擴散模型的訓(xùn)練,當(dāng)訓(xùn)練完成后,得到訓(xùn)練后的服裝穿衣模型,將提示詞以及所需的衣服圖片輸入至訓(xùn)練后的擴散模型,生成模特穿衣圖片。6、第二方面,本發(fā)明提供了一種實現(xiàn)高質(zhì)量模特穿衣的裝置,包括:7、獲取訓(xùn)練數(shù)據(jù)模塊,在服裝圖片庫中,通過quality_filter函數(shù)篩選圖像;通過blur_detection剔除設(shè)定模糊度的圖像;通過lighting_analysis評估光照的均勻性,刪除其中不符合均勻條件的圖像,得到圖像數(shù)據(jù);最終篩選得到設(shè)定數(shù)量的圖像,作為訓(xùn)練數(shù)據(jù);并獲取訓(xùn)練數(shù)據(jù)對應(yīng)的模特展示圖,作為目標數(shù)據(jù);8、提取特征向量模塊,通過基于swin-unet架構(gòu)的特征提取器和現(xiàn)有的算法將訓(xùn)練數(shù)據(jù)中的圖像進行特征向量的提取,并進行融合,得到衣服特征向量;9、生成圖片模塊,將所述衣服特征向量以及對應(yīng)的目標數(shù)據(jù)輸入至擴散模型中,進行擴散模型的訓(xùn)練,當(dāng)訓(xùn)練完成后,得到訓(xùn)練后的服裝穿衣模型,將提示詞以及所需的衣服圖片輸入至訓(xùn)練后的擴散模型,生成模特穿衣圖片。10、第三方面,本發(fā)明提供了一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)第一方面所述的方法。11、第四方面,本發(fā)明提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)第一方面所述的方法。12、本發(fā)明提供的一個或多個技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點:13、本發(fā)明通過特定的方式獲取到衣服特征向量,該準確的向量為訓(xùn)練擴散模型提供了良好的基礎(chǔ),使得訓(xùn)練完成的模型對于服裝細節(jié)特征的捕捉和重建能力較強,保證服裝不會出現(xiàn)細節(jié)模糊或失真;在對服裝材質(zhì)和光照建模上足夠精確,保證了色彩還原度,降低了色差;使得生成的穿著效果自然;使得生成的圖片可以滿足用戶的使用,用戶可以直接將該圖片上傳其線上店鋪,用于商品的展示。14、上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。技術(shù)特征:1.一種實現(xiàn)高質(zhì)量模特穿衣的方法,其特征在于:包括下述步驟:2.根據(jù)權(quán)利要求1所述的一種實現(xiàn)高質(zhì)量模特穿衣的方法,其特征在于:所述步驟1具體為:在服裝圖片庫中,通過quality_filter函數(shù)篩選出分辨率大于2048×2048的圖像;通過blur_detection剔除設(shè)定模糊度的高清圖像;通過lighting_analysis評估光照的均勻性,刪除其中不符合均勻條件的高清圖像,得到訓(xùn)練圖像數(shù)據(jù);并獲取訓(xùn)練數(shù)據(jù)對應(yīng)的模特展示圖,作為目標數(shù)據(jù);3.根據(jù)權(quán)利要求1所述的一種實現(xiàn)高質(zhì)量模特穿衣的方法,其特征在于:所述步驟2具體為:通過基于swin-unet架構(gòu)的特征提取器和現(xiàn)有的算法將訓(xùn)練數(shù)據(jù)中的圖像進行特征向量的提取,并進行融合,得到衣服特征向量;4.根據(jù)權(quán)利要求1所述的一種實現(xiàn)高質(zhì)量模特穿衣的方法,其特征在于:所述步驟3具體為:將所述衣服特征向量以及對應(yīng)的目標數(shù)據(jù)輸入至擴散模型中,進行擴散模型的訓(xùn)練,所述擴散模型為stable?diffusion模型,stable?diffusion模型中采用euler采樣器進行采樣;在u-net架構(gòu)中增加cross-attention層,用于將所述衣服特征向量作為條件信息引導(dǎo)stable?diffusion模型生成過程;stable?diffusion模型采用交叉注意力機制,stablediffusion模型中參數(shù)設(shè)定包括:β調(diào)度采用余弦策略,設(shè)定cross-attention頭數(shù)量為8;結(jié)合預(yù)訓(xùn)練的swin-unet提取結(jié)果,進行10輪次的微調(diào)訓(xùn)練,得到最后服裝穿衣模型;5.一種實現(xiàn)高質(zhì)量模特穿衣的裝置,其特征在于:包括:6.根據(jù)權(quán)利要求5所述的一種實現(xiàn)高質(zhì)量模特穿衣的裝置,其特征在于:所述獲取訓(xùn)練數(shù)據(jù)模塊具體為:在服裝圖片庫中,通過quality_filter函數(shù)篩選出分辨率大于2048×2048的圖像;通過blur_detection剔除設(shè)定模糊度的高清圖像;通過lighting_analysis評估光照的均勻性,刪除其中不符合均勻條件的高清圖像,得到訓(xùn)練圖像數(shù)據(jù);并獲取訓(xùn)練數(shù)據(jù)對應(yīng)的模特展示圖,作為目標數(shù)據(jù);7.根據(jù)權(quán)利要求5所述的一種實現(xiàn)高質(zhì)量模特穿衣的裝置,其特征在于:所述提取特征向量模塊具體為:通過基于swin-unet架構(gòu)的特征提取器和現(xiàn)有的算法將訓(xùn)練數(shù)據(jù)中的圖像進行特征向量的提取,并進行融合,得到衣服特征向量;8.根據(jù)權(quán)利要求5所述的一種實現(xiàn)高質(zhì)量模特穿衣的裝置,其特征在于:所述生成圖片模塊具體為:將所述衣服特征向量以及對應(yīng)的目標數(shù)據(jù)輸入至擴散模型中,進行擴散模型的訓(xùn)練,所述擴散模型為stable?diffusion模型,stable?diffusion模型中采用euler采樣器進行采樣;在u-net架構(gòu)中增加cross-attention層,用于將所述衣服特征向量作為條件信息引導(dǎo)stable?diffusion模型生成過程;stable?diffusion模型采用交叉注意力機制,stable?diffusion模型中參數(shù)設(shè)定包括:β調(diào)度采用余弦策略,設(shè)定cross-attention頭數(shù)量為8;結(jié)合預(yù)訓(xùn)練的swin-unet提取結(jié)果,進行10輪次的微調(diào)訓(xùn)練,得到最后服裝穿衣模型;9.一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)如權(quán)利要求1至4任一項所述的方法。10.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至4任一項所述的方法。技術(shù)總結(jié)本發(fā)明提供一種實現(xiàn)高質(zhì)量模特穿衣的方法、裝置、設(shè)備和介質(zhì),方法包括:在服裝圖片庫中,篩選圖像;剔除設(shè)定模糊度的圖像;評估光照的均勻性,刪除其中不符合均勻條件的圖像,得到圖像數(shù)據(jù);最終篩選得到設(shè)定數(shù)量的圖像,作為訓(xùn)練數(shù)據(jù);并獲取訓(xùn)練數(shù)據(jù)對應(yīng)的模特展示圖,作為目標數(shù)據(jù);通過特征提取器和現(xiàn)有的算法將訓(xùn)練數(shù)據(jù)中的圖像進行特征向量的提取,并進行融合,得到衣服特征向量;將所述衣服特征向量以及對應(yīng)的目標數(shù)據(jù)輸入至擴散模型中,進行擴散模型的訓(xùn)練,當(dāng)訓(xùn)練完成后,得到訓(xùn)練后的服裝穿衣模型,將提示詞以及所需的衣服圖片輸入至訓(xùn)練后的擴散模型,生成模特穿衣圖片,實現(xiàn)針對不同模特的高質(zhì)量生成式服飾穿衣效果。技術(shù)研發(fā)人員:劉志海,盧雨畋受保護的技術(shù)使用者:福建紫訊信息科技有限公司技術(shù)研發(fā)日:技術(shù)公布日:2025/5/29