本發(fā)明屬于工程測(cè)量,尤其涉及一種ls-svm/mpa-bp組合模型擬合gnss高程異常方法。
背景技術(shù):
1、近年來,全球?qū)Ш叫l(wèi)星系統(tǒng)測(cè)量技術(shù)在工程測(cè)量領(lǐng)域已經(jīng)成為提供高精度三維定位數(shù)據(jù)的主要手段,其高程測(cè)量主要提供大地高,以參考橢球?yàn)榛鶞?zhǔn)。其中,全球?qū)Ш叫l(wèi)星系統(tǒng)的英文為globalnavigation?satellite?system,縮寫為gnss。然而,大地高并不能直接反映實(shí)際地形起伏和重力變化,并且我國(guó)工程應(yīng)用中通常需要使用正常高,以似大地水準(zhǔn)面為基準(zhǔn)。因此,為了將gnss測(cè)得的大地高轉(zhuǎn)換為實(shí)際需求的正常高,需計(jì)算大地高與正常高的差值,即高程異常。
2、目前,gnss高程異常擬合方法有函數(shù)模型擬合法、地球重力場(chǎng)模型法、機(jī)器學(xué)習(xí)法等。函數(shù)模型擬合法都是通過擬合出與高程異常相近似的趨勢(shì)面來代替擬合區(qū)域的似大地水準(zhǔn)面,而似大地水準(zhǔn)面是物理曲面,很難用數(shù)學(xué)函數(shù)完全逼近,因此產(chǎn)生的擬合誤差相對(duì)較大。地球重力場(chǎng)模型法因?yàn)橐@得重力數(shù)據(jù),且模型的空間分辨率有限,使得模型的最好精度約為20cm。機(jī)器學(xué)習(xí)模型作為一種新型處理非線性數(shù)據(jù)擬合的技術(shù)近年來得到飛速的發(fā)展,但其初始化參數(shù)是隨機(jī)的,從而很大程度上影響擬合高程異常精度。
3、總的來說,各種擬合方法各有優(yōu)劣,但不同學(xué)者的研究均表明機(jī)器學(xué)習(xí)模型擬合的高程異常精度顯著優(yōu)于前兩種,其中最常用的機(jī)器學(xué)習(xí)模型是支持向量機(jī)模型和bp神經(jīng)網(wǎng)絡(luò)模型。其中,支持向量機(jī)模型的英文為supportvectormodel,縮寫為svm;bp神經(jīng)網(wǎng)絡(luò)模型的英文為backpropagationneuralnetwork,縮寫為bpnn。svm模型因其核函數(shù)的靈活性,所以能夠有效捕捉高程異常與其高斯平面坐標(biāo)、數(shù)字高程模型等特征之間復(fù)雜的非線性關(guān)系,提高擬合精度。其中,數(shù)字高程模型的英文為digital?elevation?model,縮寫為dem。并且對(duì)目標(biāo)函數(shù)加入了正則化項(xiàng),能夠平衡模型復(fù)雜度與誤差,減少過擬合的風(fēng)險(xiǎn)。但是它也存在著許多缺點(diǎn),例如:①難以處理大規(guī)模數(shù)據(jù),對(duì)于大規(guī)模gnss數(shù)據(jù)可能導(dǎo)致核矩陣超出計(jì)算機(jī)的內(nèi)存限制,導(dǎo)致無法高效處理;②對(duì)非均勻數(shù)據(jù)分布適應(yīng)性有限,樣本密集區(qū)域會(huì)導(dǎo)致過擬合,樣本稀疏區(qū)域會(huì)導(dǎo)致預(yù)測(cè)偏差;③核函數(shù)選擇的局限性,在區(qū)域高程異常具有多尺度特征時(shí),局部地勢(shì)起伏不均勻或整體地勢(shì)較為平緩,單一核函數(shù)可能無法兼顧局部和全局特征。對(duì)bp神經(jīng)網(wǎng)絡(luò)來說,因其簡(jiǎn)單的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和自適應(yīng)性強(qiáng)的特點(diǎn),在gnss高程異常擬合中廣泛使用。但是由于其初始化參數(shù)是隨機(jī)生成的,因此對(duì)擬合精度有重大影響。同時(shí)bp神經(jīng)網(wǎng)絡(luò)通過梯度下降算法進(jìn)行優(yōu)化,容易陷入局部最優(yōu)解。在高程異常擬合中,如果數(shù)據(jù)分布復(fù)雜,則模型可能無法找到全局最優(yōu)解。針對(duì)bp神經(jīng)網(wǎng)絡(luò)存在的缺陷,一些學(xué)者提出采用一些優(yōu)化算法來確定bp神經(jīng)網(wǎng)絡(luò)最優(yōu)初始參數(shù),從而提高擬合精度。目前,已經(jīng)應(yīng)用到帶狀區(qū)域高程轉(zhuǎn)換的優(yōu)化算法主要有遺傳算法和麻雀算法。這些算法相較于傳統(tǒng)的bp神經(jīng)網(wǎng)絡(luò)均能有效提高高程轉(zhuǎn)換的精度,取得了不錯(cuò)的效果。但是,上述這兩種模型來說,使用單一的機(jī)器學(xué)習(xí)模型擬合gnss高程異常都未考慮到擬合高程異常殘差信息。從而,導(dǎo)致了高程異常擬合轉(zhuǎn)換精度不夠高,捕捉非線性變化不夠精確。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述技術(shù)問題,本發(fā)明提供了一種ls-svm/mpa-bp組合模型擬合gnss高程異常方法,其中,部分處理采用最小二乘算法優(yōu)化svm模型;部分處理采用海洋捕食者算法優(yōu)化bp神經(jīng)網(wǎng)絡(luò)模型的組合模型來實(shí)現(xiàn)高程轉(zhuǎn)換。其中,最小二乘算法的英文為leastsquares,縮寫為ls;海洋捕食者算法的英文為marine?predatorsalgorithm,縮寫為mpa。同時(shí),結(jié)合分區(qū)擬合思想,使用組合模型對(duì)每個(gè)區(qū)域進(jìn)行精細(xì)擬合,更好地處理地理復(fù)雜性和數(shù)據(jù)分布不均勻性,實(shí)現(xiàn)線路工程高精度的高程轉(zhuǎn)換。
2、本發(fā)明通過以下技術(shù)方案得以實(shí)現(xiàn)。
3、本發(fā)明提供的一種ls-svm/mpa-bp組合模型擬合gnss高程異常方法,包括以下步驟:
4、s1、獲取測(cè)量區(qū)域,通過rf模型對(duì)測(cè)量區(qū)域進(jìn)行分區(qū),獲取若干子區(qū)域;
5、s2、選取一個(gè)子區(qū)域作為當(dāng)前分區(qū),所述當(dāng)前分區(qū)包括子區(qū)域已知點(diǎn)和子區(qū)域待測(cè)點(diǎn);
6、s3、根據(jù)子區(qū)域已知點(diǎn)的特征變量訓(xùn)練ls-svm模型,所述ls-svm模型用于計(jì)算擬合高程異常值,所述子區(qū)域已知點(diǎn)的特征變量包括子區(qū)域已知點(diǎn)高斯投影坐標(biāo)、子區(qū)域已知點(diǎn)dem數(shù)據(jù)和實(shí)測(cè)高程異常值;
7、s4、將子區(qū)域已知點(diǎn)的特征變量輸入ls-svm模型,獲取子區(qū)域已知點(diǎn)擬合高程異常值;
8、s5、根據(jù)子區(qū)域已知點(diǎn)的特征變量、子區(qū)域已知點(diǎn)擬合高程異常值訓(xùn)練mpa-bp模型,所述mpa-bp模型用于計(jì)算擬合高程異常殘差;
9、s6、將子區(qū)域待測(cè)點(diǎn)的特征變量輸入ls-svm模型,獲取子區(qū)域待測(cè)點(diǎn)擬合高程異常值,所述子區(qū)域待測(cè)點(diǎn)的特征變量包括子區(qū)域待測(cè)點(diǎn)高斯投影坐標(biāo)和dem數(shù)據(jù);
10、s7、將子區(qū)域待測(cè)點(diǎn)的特征變量和子區(qū)域待測(cè)點(diǎn)擬合高程異常值輸入mpa-bp模型,獲取子區(qū)域待測(cè)點(diǎn)擬合高程異常殘差;
11、s8、根據(jù)子區(qū)域待測(cè)點(diǎn)擬合高程異常值和子區(qū)域待測(cè)點(diǎn)擬合高程異常殘差計(jì)算子區(qū)域待測(cè)點(diǎn)高程異常值,獲取當(dāng)前分區(qū)高程異常值;
12、s9、選取未被選取過的子區(qū)域作為當(dāng)前分區(qū),重復(fù)步驟s3~s8,直至所有子區(qū)域都已被選取過,獲取測(cè)量區(qū)域高程異常。
13、優(yōu)選地,所述獲取測(cè)量區(qū)域,通過rf模型對(duì)測(cè)量區(qū)域進(jìn)行分區(qū),獲取若干子區(qū)域包括以下步驟:
14、s11、獲取測(cè)量區(qū)域,設(shè)置rf模型的參數(shù);其中,所述測(cè)量區(qū)域包括若干已知點(diǎn),所述rf模型的參數(shù)包括決策樹數(shù)量、訓(xùn)練樣本數(shù)k和采樣集數(shù)m;
15、s12、通過rf模型對(duì)測(cè)量區(qū)域的已知點(diǎn)有放回的重復(fù)隨機(jī)抽取k個(gè)訓(xùn)練樣本;
16、s13、重復(fù)m次步驟s12,獲取m個(gè)采樣集;
17、s14、對(duì)m個(gè)采樣集通過構(gòu)建決策樹訓(xùn)練形成對(duì)應(yīng)的m個(gè)分類結(jié)果;
18、s15、將m個(gè)分類結(jié)果通過結(jié)合策略得到模型輸出,獲取若干子區(qū)域。
19、優(yōu)選地,所述根據(jù)子區(qū)域已知點(diǎn)的特征變量訓(xùn)練ls-svm模型包括以下步驟:
20、s31、對(duì)子區(qū)域已知點(diǎn)進(jìn)行選點(diǎn),獲取訓(xùn)練集和驗(yàn)證集,設(shè)置訓(xùn)練誤差停止條件,所述訓(xùn)練集包括若干個(gè)訓(xùn)練樣本;
21、s32、以子區(qū)域已知點(diǎn)高斯投影坐標(biāo)、子區(qū)域已知點(diǎn)dem數(shù)據(jù)作為訓(xùn)練樣本的特征變量,以實(shí)測(cè)高程異常值作為目標(biāo)變量;
22、s33、根據(jù)訓(xùn)練樣本的特征變量和目標(biāo)變量確定svm目標(biāo)函數(shù),確定對(duì)應(yīng)約束條件,獲取svm模型;
23、s34、通過最小二乘算法優(yōu)化svm模型,更新svm模型;
24、s35、根據(jù)驗(yàn)證集計(jì)算svm模型的訓(xùn)練誤差,判斷svm模型的訓(xùn)練誤差是否滿足訓(xùn)練誤差停止條件,如果是,則獲取ls-svm模型,否則回到步驟s34。
25、優(yōu)選地,所述svm目標(biāo)函數(shù)的表達(dá)式為:
26、
27、其中,d為訓(xùn)練樣本的個(gè)數(shù)、m為訓(xùn)練樣本維數(shù)、w∈rm為權(quán)矢量、c為正則化參數(shù)、εi為容忍偏差;
28、所述對(duì)應(yīng)約束條件的表達(dá)式為:
29、yi=wtg(xi)+b+εi?i=1,...,d
30、其中,d為訓(xùn)練樣本的個(gè)數(shù)、g(xi)為映射函數(shù)、b為偏置量、εi為容忍偏差。
31、優(yōu)選地,所述通過最小二乘算法優(yōu)化svm模型,更新svm模型包括以下步驟:
32、s341、獲取優(yōu)化條件,根據(jù)svm模型定義拉格朗日函數(shù);
33、s342、根據(jù)優(yōu)化條件計(jì)算拉格朗日函數(shù),獲取svm優(yōu)化方程組;
34、s343、整理svm優(yōu)化方程組,獲取svm模型;
35、所述拉格朗日函數(shù)的表達(dá)式為:
36、
37、其中,d為訓(xùn)練樣本的個(gè)數(shù)、w∈rm為權(quán)矢量、c為正則化參數(shù)、εi為容忍偏差、g(xi)為映射函數(shù)、b為偏置量、a為拉格朗日乘子;
38、所述svm優(yōu)化方程組的表達(dá)式為:
39、
40、其中,m為訓(xùn)練樣本維數(shù)、w∈rm為權(quán)矢量、c為正則化參數(shù)、εi為容忍偏差、g(xi)為映射函數(shù)、b為偏置量、ai為拉格朗日乘子;
41、svm模型的表達(dá)式為:
42、
43、其中,d為訓(xùn)練樣本的個(gè)數(shù)、g(xi)為映射函數(shù)、b為偏置量、ai為拉格朗日乘子。
44、優(yōu)選地,所述根據(jù)子區(qū)域已知點(diǎn)的特征變量、子區(qū)域已知點(diǎn)擬合高程異常值訓(xùn)練mpa-bp模型包括以下步驟:
45、s51、初始化bp神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),設(shè)置誤差精度要求,所述bp神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、隱含層、輸出層、權(quán)值和偏置值;
46、s52、根據(jù)實(shí)測(cè)高程異常值和子區(qū)域已知點(diǎn)擬合高程異常值計(jì)算擬合高程異常殘差;
47、s53、將子區(qū)域已知點(diǎn)高斯坐標(biāo)投影、子區(qū)域已知點(diǎn)dem數(shù)據(jù)和子區(qū)域已知點(diǎn)擬合高程異常值作為輸入層,擬合高程異常殘差作為期望輸出層,訓(xùn)練bp神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);
48、s54、采用mpa算法修正權(quán)值和偏置值,更新bp神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);
49、s55、計(jì)算bp神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練誤差,判斷是否滿足誤差精度要求,如果是,則獲取mpa-bp神經(jīng)網(wǎng)絡(luò)模型,否則回到步驟s54。
50、優(yōu)選地,所述采用mpa算法修正權(quán)值和偏置值,更新bp神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括以下步驟:
51、s541、設(shè)置適應(yīng)度精度要求,根據(jù)bp神經(jīng)網(wǎng)絡(luò)模型的權(quán)值和偏置值初始化獵物矩陣和捕食者矩陣;
52、s542、通過模擬捕食者與獵物之間的最佳相遇率策略優(yōu)化獵物矩陣,更新并記錄獵物矩陣;
53、s543、計(jì)算獵物矩陣的適應(yīng)度,檢測(cè)頂級(jí)捕食者,更新捕食者矩陣;
54、s544、判斷捕食者矩陣的適應(yīng)度是否滿足適應(yīng)度精度要求,如果是,則進(jìn)入步驟s545,否則回到步驟s542;
55、s545、根據(jù)捕食者矩陣獲取最優(yōu)權(quán)值位置和最優(yōu)偏置值位置,將最優(yōu)權(quán)值位置的權(quán)值和最優(yōu)偏置值位置的偏置值作為bp神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的初始化參數(shù)。
56、優(yōu)選地,所述通過模擬捕食者與獵物之間的最佳相遇率策略優(yōu)化獵物矩陣,更新并記錄獵物矩陣包括以下步驟:
57、s5421、模擬獵物的高速逃逸行為,獲取高速逃逸優(yōu)化策略,根據(jù)高速逃逸優(yōu)化獵物矩陣;
58、s5422、模擬獵物和捕食者速度相當(dāng)時(shí)的隨機(jī)游泳行為,獲取速度相當(dāng)逃逸策略,根據(jù)速度相當(dāng)逃逸策略優(yōu)化獵物矩陣;
59、s5423、模擬獵物的低速逃逸行為,獲取低速逃逸策略,根據(jù)低速逃逸策略優(yōu)化獵物矩陣;
60、s5424、模擬渦流形成和魚群聚集裝置效應(yīng),獲取渦流和分散效應(yīng)策略,根據(jù)渦流和分散效應(yīng)策略優(yōu)化獵物矩陣,并將獵物矩陣記錄下來。
61、優(yōu)選地,所述高速逃逸優(yōu)化策略的表達(dá)式為:
62、
63、其中,表示第i個(gè)個(gè)體的移動(dòng)步長(zhǎng)、為包含基于表示brownian運(yùn)動(dòng)的正態(tài)分布的隨機(jī)數(shù)、n為種群數(shù)、p是一個(gè)常數(shù)、是[0,1]中的均勻隨機(jī)數(shù)向量、prey為獵物矩陣、elite為捕食者矩陣;
64、所述速度相當(dāng)逃逸策略具體指:將種群均分為兩部分,一部分為探索種群,一部分為開發(fā)種群;
65、所述探索種群的表達(dá)式為:
66、
67、其中,表示第i個(gè)個(gè)體的移動(dòng)步長(zhǎng)、是基于lévy分布的隨機(jī)數(shù)向量、n為種群數(shù)、p是一個(gè)常數(shù)、是[0,1]中的均勻隨機(jī)數(shù)向量、prey為獵物矩陣、elite為捕食者矩陣;
68、所述開發(fā)種群的表達(dá)式為:
69、
70、
71、其中,表示第i個(gè)個(gè)體的移動(dòng)步長(zhǎng)、為包含基于表示brownian運(yùn)動(dòng)的正態(tài)分布的隨機(jī)數(shù)、n為種群數(shù)、p是一個(gè)常數(shù)、prey為獵物矩陣、elite為捕食者矩陣、iter為當(dāng)前迭代次數(shù)、max_iter為最大迭代次數(shù)、cf為縮放因子;
72、所述低速逃逸策略的表達(dá)式為:
73、
74、其中,表示第i個(gè)個(gè)體的移動(dòng)步長(zhǎng)、為包含基于表示brownian運(yùn)動(dòng)的正態(tài)分布的隨機(jī)數(shù)、n為種群數(shù)、p是一個(gè)常數(shù)、prey為獵物矩陣、elite為捕食者矩陣、cf為縮放因子。
75、優(yōu)選地,所述渦流和分散效應(yīng)策略的表達(dá)式為:
76、
77、其中,fads是魚群聚集裝置效應(yīng)對(duì)優(yōu)化過程影響的概率、是包括0和1的二進(jìn)制向量、r是[0,1]中的隨機(jī)數(shù)、xmax和xmin表示維度下限的向量、r1和r2下標(biāo)表示prey矩陣的隨機(jī)索引、prey為獵物矩陣、cf為縮放因子、是[0,1]中的均勻隨機(jī)數(shù)向量。
78、本發(fā)明的有益效果在于:
79、1、采用ls-svm/mpa-bp神經(jīng)網(wǎng)絡(luò)組合模型分區(qū)擬合帶狀區(qū)域gnss高程異常的方法,充分利用不同高程異常擬合模型優(yōu)勢(shì),在不需要確定幾何曲面的情況下,利用少量gnss/水準(zhǔn)樣本點(diǎn)空間中就能解決訓(xùn)練集產(chǎn)生的局部最優(yōu)值和模型不確定初始化參數(shù)的問題,從而可實(shí)現(xiàn)大地高到正常高的高精度轉(zhuǎn)換;
80、2、相比函數(shù)模型擬合法和地球重力場(chǎng)法更能夠捕捉到高程異常的非線性特征,其與整體區(qū)域擬合相比,更考慮了區(qū)域地勢(shì)起伏和數(shù)據(jù)點(diǎn)部分不均情況下利用ls-svm模型對(duì)帶狀區(qū)域gnss高程異常擬合的影響,對(duì)每個(gè)區(qū)域選擇適合的核函數(shù)進(jìn)行精細(xì)化擬合可以更有效地減少高程異常的偏差,滿足工程需求;
81、3、與標(biāo)準(zhǔn)bp神經(jīng)網(wǎng)絡(luò)相比,mpa優(yōu)化算法可以優(yōu)化bp神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,使bp神經(jīng)網(wǎng)絡(luò)在擬合時(shí)其權(quán)值閾值是較優(yōu)值,以此來提高擬合高程異常殘差的擬合精度,并且與現(xiàn)有的優(yōu)化bp神經(jīng)網(wǎng)絡(luò)算法相比,mpa算法在高程轉(zhuǎn)換中表現(xiàn)出更好的擬合效果;
82、4、再將ls-svm模型擬合的gnss高程異常結(jié)合mpa-bp神經(jīng)網(wǎng)絡(luò)擬合的高程異常殘差,達(dá)到對(duì)gnss高程異常擬合值的改正,比單一ls-svm模型擬合高程異常取得更優(yōu)的高程轉(zhuǎn)換結(jié)果;
83、5、這種分區(qū)和組合模型的方法對(duì)于長(zhǎng)距離、大范圍帶狀地形高程異常變化復(fù)雜的情況下一樣適用,增加了模型擬合gnss高程異常的適用范圍。