本發(fā)明涉及基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,屬于知識(shí)圖譜嵌入。
背景技術(shù):
1、知識(shí)圖譜(kg)是通過(guò)圖結(jié)構(gòu)來(lái)表示現(xiàn)實(shí)世界中實(shí)體及其關(guān)系的一種知識(shí)表示方法,在搜索引擎、問(wèn)答系統(tǒng)和推薦系統(tǒng)中都有應(yīng)用。現(xiàn)有的知識(shí)圖譜庫(kù),例如wordnet、freebase、yago等,都存在一個(gè)普遍的問(wèn)題:隨著信息指數(shù)級(jí)的增長(zhǎng),保持最新的知識(shí)圖譜變得越來(lái)越具有挑戰(zhàn)性,導(dǎo)致大多數(shù)現(xiàn)實(shí)世界的知識(shí)圖譜存在不完整的問(wèn)題。圖譜不完整的問(wèn)題會(huì)給上述提出的應(yīng)用方法帶來(lái)預(yù)測(cè)不準(zhǔn)確、推薦不正確的影響,因此,越來(lái)越多的研究集中在知識(shí)圖譜的完成(kgc)上。鏈接預(yù)測(cè)(lp)是一種重要的知識(shí)圖譜補(bǔ)全方法,鏈接預(yù)測(cè)使用知識(shí)圖譜中的已知事實(shí)來(lái)推斷丟失的三元組信息。如圖1顯示了一個(gè)簡(jiǎn)單的不完整知識(shí)圖譜的示例,其中文字表示現(xiàn)有事實(shí),?表示必須推斷的信息。例如,我們需要預(yù)測(cè)(張三,出生,?)中缺失的實(shí)體,或(李四,?,紅米)中缺失的關(guān)系。
2、知識(shí)圖譜嵌入(簡(jiǎn)稱(chēng)kge)是現(xiàn)在廣泛使用的一種鏈接預(yù)測(cè)方法,其將知識(shí)圖譜中三元組信息轉(zhuǎn)變到一個(gè)連續(xù)的向量空間中,保留知識(shí)圖譜中的邏輯關(guān)系信息,之后利用某種模型實(shí)現(xiàn)推斷丟失的三元組信息(事實(shí))。使用知識(shí)圖譜嵌入模型的好處是可以更好的利用知識(shí)圖譜中的結(jié)構(gòu)信息和語(yǔ)義信息,并且能實(shí)現(xiàn)知識(shí)圖譜組成元素的語(yǔ)義向量化表達(dá)。一般可以將知識(shí)圖譜嵌入模型分為三類(lèi):基于翻譯的嵌入模型、基于語(yǔ)義匹配的嵌入模型和基于神經(jīng)網(wǎng)絡(luò)的嵌入模型。
3、基于翻譯的嵌入模型是知識(shí)圖譜嵌入領(lǐng)域中的一類(lèi)重要方法,這類(lèi)模型的核心思想是將關(guān)系視為從頭實(shí)體到尾實(shí)體的翻譯,并隨后通過(guò)定義基于距離的得分函數(shù)來(lái)評(píng)估候選三元組的有效性。最經(jīng)典的基于翻譯的嵌入模型的模型是transe,它將實(shí)體和關(guān)系映射到低維向量空間,從而實(shí)現(xiàn)三元組(實(shí)體-關(guān)系-實(shí)體)的表示。這種簡(jiǎn)單的假設(shè)可以在處理大規(guī)模簡(jiǎn)單關(guān)系的知識(shí)圖譜中取得很好的結(jié)果,但是在捕捉復(fù)雜關(guān)系和語(yǔ)義信息的場(chǎng)景中,表現(xiàn)的往往不如人意。為了解決這個(gè)問(wèn)題,transh在transe的基礎(chǔ)上引入關(guān)系超平面來(lái)區(qū)分不同類(lèi)型的關(guān)系,使實(shí)體的語(yǔ)義表示可以根據(jù)關(guān)系進(jìn)行調(diào)整,增強(qiáng)了對(duì)一對(duì)多、多對(duì)一等復(fù)雜關(guān)系的表達(dá)能力;transr在transh的基礎(chǔ)上進(jìn)一步將實(shí)體空間和關(guān)系空間分離,為每個(gè)關(guān)系引入一個(gè)映射矩陣,將實(shí)體從實(shí)體空間投影到關(guān)系特定的空間進(jìn)行操作,能適應(yīng)多對(duì)多等復(fù)雜多樣的關(guān)系類(lèi)型。transc解決參數(shù)冗余和對(duì)稀疏數(shù)據(jù)處理不佳的問(wèn)題,引入聚類(lèi)的概念,將具有相似語(yǔ)義的關(guān)系進(jìn)行聚類(lèi),以進(jìn)一步增強(qiáng)模型的表示能力和泛化能力。類(lèi)似類(lèi)型的kge模型還有transd,transg,transa,transparse,等等。
4、基于語(yǔ)義匹配的嵌入模型是知識(shí)圖譜嵌入領(lǐng)域中的另一種重要方法,這類(lèi)模型通過(guò)設(shè)計(jì)合適的相似度函數(shù)度量實(shí)體和關(guān)系之間的相似度,進(jìn)而捕捉知識(shí)圖譜中的語(yǔ)義信息。例如,rescal通過(guò)秩三分解的方法將關(guān)系視為一個(gè)二階張量,然后將實(shí)體和關(guān)系表示為矩陣和向量的乘積,從而捕捉實(shí)體和關(guān)系之間的表示和預(yù)測(cè);distmult通過(guò)點(diǎn)積操作來(lái)計(jì)算三元組的得分,從而預(yù)測(cè)知識(shí)圖譜中的實(shí)體嵌入;complex通過(guò)利用復(fù)雜數(shù)的實(shí)部和虛部來(lái)表示實(shí)體和關(guān)系,使用點(diǎn)積來(lái)計(jì)算實(shí)體和關(guān)系的相似度;hole將rescal和dismult的優(yōu)勢(shì)結(jié)合起來(lái),利用兩種模型的優(yōu)勢(shì)進(jìn)行互補(bǔ);simple為每個(gè)實(shí)體學(xué)習(xí)了兩個(gè)獨(dú)立的嵌入向量,可以通過(guò)權(quán)重綁定將某些類(lèi)型的背景知識(shí)納入這些嵌入中;rotate將實(shí)體和關(guān)系嵌入到復(fù)數(shù)空間中,在復(fù)數(shù)平面上對(duì)實(shí)體操作來(lái)表示知識(shí)圖譜中的三元組。與基于翻譯的嵌入模型使用加法運(yùn)算相比,基于語(yǔ)義匹配的嵌入模型通常依賴(lài)相似性度量(如點(diǎn)積、余弦相似度或雙線性函數(shù)),由于需要計(jì)算復(fù)雜的相似性函數(shù),計(jì)算復(fù)雜性相對(duì)較高,導(dǎo)致比平移距離模型更好的性能,但它們的計(jì)算復(fù)雜度通常更高。
5、基于神經(jīng)網(wǎng)絡(luò)的嵌入模型在知識(shí)圖譜實(shí)體嵌入領(lǐng)域中具有廣泛應(yīng)用,它通過(guò)設(shè)計(jì)復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)和特征提取方法,能夠捕捉知識(shí)圖譜中復(fù)雜的關(guān)系和語(yǔ)義信息,提高嵌入表示的準(zhǔn)確性和預(yù)測(cè)能力。例如,ntn使用一個(gè)神經(jīng)網(wǎng)絡(luò)層和一個(gè)張量層將實(shí)體和關(guān)系映射到高維空間中,從而學(xué)習(xí)實(shí)體和關(guān)系的表示;slm使用單個(gè)全連接層的非線性操作來(lái)實(shí)現(xiàn)隱式鏈接實(shí)體和關(guān)系嵌入。目前,由于卷積網(wǎng)絡(luò)強(qiáng)大的提取隱含在實(shí)體和關(guān)系之間的語(yǔ)義信息能力,已被廣泛應(yīng)用于知識(shí)嵌入。圖2中(a)展示了基于卷積網(wǎng)絡(luò)的嵌入模型的一般流程圖。首先,向量h,r拼接并且重構(gòu)為一個(gè)二維圖像;然后將新生成的二維圖像輸入到基于卷積神經(jīng)網(wǎng)絡(luò)的模塊中得到輸出的新特征圖;最后將得到的輸出特征圖用作對(duì)應(yīng)于候選三元組的分?jǐn)?shù),其中正確的三元組的分?jǐn)?shù)高于錯(cuò)誤的三元組的分?jǐn)?shù)。最具代表性的是conve,具體地說(shuō),conve將實(shí)體和關(guān)系嵌入重構(gòu)為二維矩陣,并使用過(guò)濾器提取更高級(jí)別的非線性特征,從而捕捉實(shí)體和關(guān)系之間的復(fù)雜交互;covekb采用一維卷積神經(jīng)網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),輸入頭實(shí)體、尾實(shí)體和關(guān)系的嵌入,從而可以捕獲知識(shí)庫(kù)中實(shí)體和關(guān)系之間的全局關(guān)系和過(guò)渡特征;convr從關(guān)系表示中自適應(yīng)地構(gòu)建卷積濾波器,采用二維卷積神經(jīng)網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),并在實(shí)體表示中應(yīng)用這些濾波器來(lái)生成卷積特征;jointe聯(lián)合使用一維卷積神經(jīng)網(wǎng)絡(luò)和二維卷積神經(jīng)網(wǎng)絡(luò)來(lái)提高模型的嵌入效果,其中一維卷積神經(jīng)網(wǎng)絡(luò)被用來(lái)提取表面和顯式知識(shí)并且二維卷積神經(jīng)網(wǎng)絡(luò)被用來(lái)促進(jìn)實(shí)體和關(guān)系之間的交互;m-dcn在conve的基礎(chǔ)上采用在重組過(guò)程中將h,r進(jìn)行了間隔堆疊的方法來(lái)增加實(shí)體和關(guān)系之間的交互;interacte利用三種整形類(lèi)型(即堆棧,交替和棋盤(pán))從實(shí)體中抽取卷積核,作為二維卷積神經(jīng)網(wǎng)絡(luò)的輸入來(lái)增加實(shí)體和關(guān)系之間的交互程度,如圖2中(b)所示。此外,一些先進(jìn)的圖學(xué)習(xí)方法也得到了廣泛的關(guān)注,r-gcn擴(kuò)展了圖卷積神經(jīng)網(wǎng)絡(luò)處理知識(shí)圖譜,能夠在多種關(guān)系類(lèi)型的圖中高效地學(xué)習(xí)節(jié)點(diǎn)表示;clgat-kgc引入了圖注意機(jī)制,為同一實(shí)體下不同的關(guān)系添加不同的實(shí)體表示,增強(qiáng)了實(shí)體-關(guān)系交互功能。
6、上述的三種知識(shí)圖譜嵌入方法各有優(yōu)勢(shì),基于翻譯的嵌入模型和基于語(yǔ)義匹配的嵌入模型利用加法、乘法等顯式的關(guān)系建模方法,將知識(shí)圖譜中的實(shí)體和關(guān)系嵌入到低維向量空間中來(lái)提取淺層的語(yǔ)義信息,可以快速的得到最終的得分。然而,這兩種方法的簡(jiǎn)單結(jié)構(gòu)使他們?cè)讷@取深層知識(shí)方面不能表現(xiàn)出良好的性能。基于神經(jīng)網(wǎng)絡(luò)的嵌入模型既可以學(xué)習(xí)到淺層的語(yǔ)義信息又可以學(xué)習(xí)到深層的知識(shí),因此現(xiàn)階段大部分方法都聚焦在對(duì)神經(jīng)網(wǎng)絡(luò)方法的使用上。基于神經(jīng)網(wǎng)絡(luò)的嵌入模型中基于全連接的模型通常聚焦于逐層信息的線性組合,缺少對(duì)多尺度上下文的建模能力。而知識(shí)圖譜中的實(shí)體和關(guān)系的語(yǔ)義信息往往涉及不同的尺度與層次,需要捕獲全局與局部特征的交互。同時(shí)基于圖神經(jīng)網(wǎng)絡(luò)的模型通過(guò)聚合鄰居來(lái)學(xué)習(xí)特征,這可能忽略知識(shí)圖譜的固有方向性。近年來(lái),基于卷積核的神經(jīng)網(wǎng)絡(luò)逐漸成為知識(shí)圖譜嵌入任務(wù)的主流模型,它利用卷積核來(lái)提取實(shí)體和關(guān)系的交互特征,并取得了良好的性能。目前應(yīng)用于知識(shí)圖譜預(yù)測(cè)領(lǐng)域比較主流的卷積神經(jīng)網(wǎng)絡(luò)有:conve、convr、jointe和interacte。然而,這些方法都關(guān)注到了特征圖中局部的信息,對(duì)于整個(gè)特征圖的關(guān)注往往是不夠的。實(shí)際上,特征圖中較遠(yuǎn)位置的特征對(duì)最終的預(yù)測(cè)結(jié)果是有實(shí)際影響意義,這些較遠(yuǎn)的信息與當(dāng)前信息的組合對(duì)模型理解實(shí)體和關(guān)系的語(yǔ)義信息會(huì)發(fā)揮重要作用。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有知識(shí)圖譜嵌入方法對(duì)特征圖的整體關(guān)注度差,影響預(yù)測(cè)結(jié)果的問(wèn)題,本發(fā)明提供一種基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法。
2、本發(fā)明的一種基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,包括,
3、對(duì)知識(shí)圖譜中的三元組進(jìn)行隨機(jī)初始化,獲得d維三元組嵌入,將d維三元組嵌入中頭實(shí)體嵌入和關(guān)系嵌入按維度進(jìn)行對(duì)應(yīng)拼接,再整形得到初始特征圖x0;
4、采用基于全局信息捕獲的語(yǔ)義信息重構(gòu)模塊對(duì)初始特征圖x0進(jìn)行特征提取,再結(jié)合所述初始特征圖x0進(jìn)行殘差處理,得到殘差后特征圖x1;
5、選擇三個(gè)不同大小的關(guān)系卷積核分別對(duì)殘差后特征圖x1進(jìn)行特征提取,得到三組特征映射圖
6、再采用基于組歸一化的特征銳化模塊對(duì)特征映射圖進(jìn)行特征銳化,得到銳化后特征圖
7、將三個(gè)銳化后特征圖分別展平并沿通道維度連接,并采用全連接層獲得隱藏層向量,所述隱藏層向量與三元組嵌入中尾實(shí)體嵌入的維度相同;再將所述隱藏層向量與三元組嵌入中尾實(shí)體嵌入進(jìn)行矩陣乘法,預(yù)測(cè)得到多個(gè)得分,將得分最高值對(duì)應(yīng)的尾實(shí)體嵌入作為尾實(shí)體預(yù)測(cè)結(jié)果,實(shí)現(xiàn)信息重構(gòu)。
8、根據(jù)本發(fā)明的基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,所述基于全局信息捕獲的語(yǔ)義信息重構(gòu)模塊依次包括深度卷積dw-conv、兩個(gè)不同膨脹率的深度膨脹卷積dw-dconv和普通卷積conv;初始特征圖x0依次輸入至深度卷積dw-conv和深度膨脹卷積dw-dconv,并由普通卷積conv輸出特征提取結(jié)果。
9、根據(jù)本發(fā)明的基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,殘差后特征圖x1表示為:
10、x1=af+x0,
11、式中af為基于全局信息捕獲的語(yǔ)義信息重構(gòu)模塊輸出的特征圖:
12、
13、式中conv1為卷積核大小為1×1的普通卷積conv,dw-conv3為卷積核大小為3×3的深度卷積dw-conv,為卷積核大小為3×3并且膨脹率為3的深度膨脹卷積dw-dconv,為卷積核大小為3×3并且膨脹率為9的深度膨脹卷積dw-dconv。
14、根據(jù)本發(fā)明的基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,三個(gè)不同大小的關(guān)系卷積核分別選擇為1×2的2×2的和3×1的
15、根據(jù)本發(fā)明的基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,三組特征映射圖為:
16、
17、式中為實(shí)數(shù)集,c為通道數(shù),h為的高度,w為的寬度。
18、根據(jù)本發(fā)明的基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,基于組歸一化的特征銳化模塊對(duì)特征映射圖進(jìn)行特征銳化的過(guò)程包括對(duì)特征映射圖進(jìn)行標(biāo)準(zhǔn)化、特征分割、特征增強(qiáng)和弱化及重組。
19、根據(jù)本發(fā)明的基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,所述標(biāo)準(zhǔn)化的方法為利用組歸一化層中的縮放因子評(píng)估特征圖的重要度:
20、
21、式中為根據(jù)組歸一化得到的歸一化結(jié)果,μi為的均值,σi為的標(biāo)準(zhǔn)差,εi為的調(diào)整參數(shù),λi和βi為組歸一化層gn的兩個(gè)訓(xùn)練調(diào)節(jié)參數(shù);
22、基于歸一化結(jié)果確定訓(xùn)練調(diào)節(jié)參數(shù)λi;再基于訓(xùn)練調(diào)節(jié)參數(shù)λi計(jì)算歸一化權(quán)重為:
23、
24、式中為第k個(gè)通道的歸一化權(quán)重,為λi對(duì)應(yīng)第k個(gè)通道的訓(xùn)練調(diào)節(jié)參數(shù),為λi對(duì)應(yīng)第j個(gè)通道的訓(xùn)練調(diào)節(jié)參數(shù);
25、再進(jìn)行特征分割:將采用歸一化權(quán)重加權(quán)后的特征映射圖通過(guò)sigmoid函數(shù)映射到(0,1)范圍,再計(jì)算調(diào)整后權(quán)重ki:
26、
27、式中g(shù)n表示對(duì)進(jìn)行組歸一化處理得到訓(xùn)練調(diào)節(jié)參數(shù)λi的過(guò)程;w()表示計(jì)算歸一化權(quán)重sigmoid()為縮放函數(shù),將值縮放到(0,1)的范圍;threshold()為閾值可調(diào)函數(shù),將大于設(shè)定權(quán)重閾值的值設(shè)置為1,小于或等于設(shè)定權(quán)重閾值的值設(shè)置為0;
28、根據(jù)調(diào)整后權(quán)重ki將大于設(shè)定權(quán)重閾值的調(diào)整后權(quán)重ki設(shè)置為1,得到權(quán)重k1i,將小于或等于設(shè)定權(quán)重閾值的調(diào)整后權(quán)重ki設(shè)置為0,得到權(quán)重k2i。
29、根據(jù)本發(fā)明的基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,基于權(quán)重k1i和權(quán)重k2i對(duì)進(jìn)行特征增強(qiáng)和弱化得到加權(quán)特征和加權(quán)特征
30、再對(duì)加權(quán)特征和加權(quán)特征進(jìn)行重組得到銳化后特征圖
31、
32、根據(jù)本發(fā)明的基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,計(jì)算得分的方法為:
33、
34、式中scores(h,r,t)表示d維三元組嵌入的得分函數(shù),其中h表示頭實(shí)體嵌入,r表示關(guān)系嵌入,t表示尾實(shí)體嵌入,f(·)表示將所述隱藏層向量投影到尾實(shí)體嵌入相同維度的空間中,vec(·)表示展平,gsr(·)表示全局特征強(qiáng)化操作,msc(·)表示近鄰特征強(qiáng)化操作,gns(·)表示特征重構(gòu)操作,r()表示整形操作,w0為隨機(jī)初始化參數(shù)矩陣。
35、根據(jù)本發(fā)明的基于全局信息語(yǔ)義重構(gòu)與多規(guī)格特征銳化框架的知識(shí)圖譜嵌入方法,選擇1-n評(píng)分實(shí)現(xiàn)得分函數(shù)scores(h,r,t)的計(jì)算;根據(jù)得分值計(jì)算交叉熵?fù)p失函數(shù)ψ(p,y),并調(diào)整調(diào)整參數(shù)εi、訓(xùn)練調(diào)節(jié)參數(shù)λi和βi;交叉熵?fù)p失函數(shù)ψ(p,y)為:
36、
37、式中p表示預(yù)測(cè)的三元組嵌入得分,y表示二進(jìn)制標(biāo)簽向量,n為三元組的總數(shù),pn為第n次預(yù)測(cè)的三元組嵌入得分,yn為第n次預(yù)測(cè)對(duì)應(yīng)的二進(jìn)制標(biāo)簽向量。
38、本發(fā)明的有益效果:本發(fā)明方法基于多規(guī)格特征銳化框架-girmsf進(jìn)行全局信息重構(gòu),它首先通過(guò)多層膨脹卷積對(duì)實(shí)體和關(guān)系組成的矩陣進(jìn)行全局信息重構(gòu),從更大感受野融合上下文信息重構(gòu)實(shí)體和關(guān)系的語(yǔ)義信息;其次,提出了一種面向重構(gòu)信息的多規(guī)格特征捕獲機(jī)制,通過(guò)從關(guān)系向量中提取不同規(guī)格的卷積核對(duì)重構(gòu)信息進(jìn)行卷積操作,抽取不同規(guī)格特征,最大可能獲取完備的特征集合,為后續(xù)進(jìn)行特征銳化提供背景特征集合;最后,采用基于組歸一化的特征銳化方法,對(duì)多規(guī)格特征進(jìn)行標(biāo)準(zhǔn)化,對(duì)標(biāo)準(zhǔn)化特征通過(guò)分割—增強(qiáng)/弱化——重組過(guò)程實(shí)現(xiàn)特征銳化,進(jìn)一步提高網(wǎng)絡(luò)模型的學(xué)習(xí)效率和預(yù)測(cè)精度。
39、本發(fā)明方法基于全局信息捕獲的實(shí)體關(guān)系進(jìn)行語(yǔ)義重構(gòu):現(xiàn)有翻譯模型都是隨機(jī)生成一個(gè)長(zhǎng)度為n的向量表達(dá)初始實(shí)體和關(guān)系的語(yǔ)義信息,可以理解用每個(gè)分量(或幾個(gè)分量)對(duì)應(yīng)表達(dá)實(shí)體(關(guān)系)名稱(chēng)的每個(gè)字段的語(yǔ)義。但是,目前的語(yǔ)義學(xué)習(xí)方法為了獲得字符或單詞的語(yǔ)義,都是從其在句中的上下文融合學(xué)習(xí)獲得其最終語(yǔ)義嵌入。為獲得準(zhǔn)確的實(shí)體和關(guān)系的語(yǔ)義信息,本發(fā)明采用的基于全局信息捕獲的信息重構(gòu)方法,采用多層膨脹卷積核對(duì)實(shí)體和關(guān)系組成的矩陣進(jìn)行全局信息捕獲,在擴(kuò)大信息感受野的同時(shí),降低了信息重構(gòu)的復(fù)雜度;
40、本發(fā)明方法實(shí)現(xiàn)了重構(gòu)語(yǔ)義信息的多規(guī)格特征捕獲:知識(shí)圖譜中三元組中關(guān)系向量的作用是將頭實(shí)體映射對(duì)齊到尾實(shí)體上,不同關(guān)系向量對(duì)同一頭實(shí)體向量的映射作用是不同的,其中包含了更多對(duì)實(shí)體的語(yǔ)義理解的信息。為了準(zhǔn)確實(shí)現(xiàn)頭實(shí)體向量與尾實(shí)體的映射,本發(fā)明從關(guān)系向量中抽取不同規(guī)格的分量組成卷積核,對(duì)重構(gòu)后的實(shí)體關(guān)系語(yǔ)義向量進(jìn)行多規(guī)格特征捕獲,通過(guò)不同角度從實(shí)體關(guān)系語(yǔ)義中獲得特征,為后續(xù)進(jìn)行特征銳化提供了背景特征集合。
41、本發(fā)明方法基于組歸一化的特征銳化:在獲得實(shí)體關(guān)系多規(guī)格特征集合后,為了進(jìn)一步“銳化”特征:強(qiáng)化強(qiáng)特征貢獻(xiàn)度、弱化弱特征干擾。本發(fā)明方法基于組歸一化對(duì)特征集合進(jìn)行標(biāo)準(zhǔn)化處理,設(shè)置“銳化”閾值,對(duì)標(biāo)準(zhǔn)化特征集合分割,一組放大高于閾值的特征值,一組降低低于閾值的特征值,兩組特征集合對(duì)位相加后重新組合成一個(gè)“銳化后”特征集合,進(jìn)一步提升了實(shí)體關(guān)系語(yǔ)義特征的顯著性。