本公開涉及機(jī)器人,具體地,涉及一種機(jī)器人狀態(tài)預(yù)測(cè)模型的訓(xùn)練方法、裝置、介質(zhì)及電子設(shè)備。
背景技術(shù):
1、機(jī)器人的應(yīng)用越來越廣泛,已經(jīng)成為各領(lǐng)域中重要的設(shè)備,例如輪式移動(dòng)機(jī)器人。輪式機(jī)器人由于其在動(dòng)態(tài)環(huán)境中的多功能性和靈活性,在工業(yè)和農(nóng)業(yè)等領(lǐng)域發(fā)揮著重要作用,輪式機(jī)器人利用本體感知數(shù)據(jù)和基準(zhǔn)地圖進(jìn)行路徑規(guī)劃和避障,并控制驅(qū)動(dòng)輪電機(jī)實(shí)現(xiàn)前進(jìn)與轉(zhuǎn)向等運(yùn)動(dòng)。
2、目前,通常通過擬合數(shù)據(jù),確定一個(gè)準(zhǔn)確表征該數(shù)據(jù)的模型,將得到的模型應(yīng)用于機(jī)器人的位姿預(yù)測(cè)場(chǎng)景中,因此對(duì)輪式機(jī)器人的動(dòng)力學(xué)進(jìn)行準(zhǔn)確建模是至關(guān)重要的。
技術(shù)實(shí)現(xiàn)思路
1、提供該
技術(shù)實(shí)現(xiàn)要素:
部分以便以簡(jiǎn)要的形式介紹構(gòu)思,這些構(gòu)思將在后面的具體實(shí)施方式部分被詳細(xì)描述。該發(fā)明內(nèi)容部分并不旨在標(biāo)識(shí)要求保護(hù)的技術(shù)方案的關(guān)鍵特征或必要特征,也不旨在用于限制所要求的保護(hù)的技術(shù)方案的范圍。
2、第一方面,本公開提供一種機(jī)器人狀態(tài)預(yù)測(cè)模型的訓(xùn)練方法,包括:
3、獲取機(jī)器人的數(shù)據(jù)集,所述數(shù)據(jù)集包括實(shí)際指令序列和實(shí)際狀態(tài)序列;
4、根據(jù)所述數(shù)據(jù)集對(duì)狀態(tài)預(yù)測(cè)模型進(jìn)行循環(huán)迭代訓(xùn)練,并在訓(xùn)練完畢時(shí),輸出訓(xùn)練完畢的狀態(tài)預(yù)測(cè)模型,在一次循環(huán)迭代訓(xùn)練過程中執(zhí)行以下操作:
5、從所述實(shí)際狀態(tài)序列中選擇實(shí)際狀態(tài)子序列,所述實(shí)際狀態(tài)子序列中各實(shí)際狀態(tài)為世界坐標(biāo)系下的數(shù)據(jù);
6、采用狀態(tài)預(yù)測(cè)模型對(duì)目標(biāo)輸入進(jìn)行處理,得到所述實(shí)際狀態(tài)子序列中各實(shí)際狀態(tài)分別對(duì)應(yīng)的中間預(yù)測(cè)狀態(tài),并對(duì)所述中間預(yù)測(cè)狀態(tài)進(jìn)行數(shù)據(jù)變換,得到處于世界坐標(biāo)系下的目標(biāo)預(yù)測(cè)狀態(tài),所述目標(biāo)輸入至少由所述實(shí)際指令序列所確定,所述狀態(tài)預(yù)測(cè)模型中與狀態(tài)相關(guān)的輸入和輸出均為局部坐標(biāo)系下的數(shù)據(jù);
7、根據(jù)由所有所述目標(biāo)預(yù)測(cè)狀態(tài)組成的預(yù)測(cè)狀態(tài)子序列和所述實(shí)際狀態(tài)子序列,更新所述狀態(tài)預(yù)測(cè)模型。
8、第二方面,本公開提供一種機(jī)器人狀態(tài)預(yù)測(cè)模型的訓(xùn)練裝置,包括:
9、獲取模塊,用于獲取機(jī)器人的數(shù)據(jù)集,所述數(shù)據(jù)集包括實(shí)際指令序列和實(shí)際狀態(tài)序列;
10、訓(xùn)練模塊,用于根據(jù)所述數(shù)據(jù)集對(duì)狀態(tài)預(yù)測(cè)模型進(jìn)行循環(huán)迭代訓(xùn)練,并在訓(xùn)練完畢時(shí),輸出訓(xùn)練完畢的狀態(tài)預(yù)測(cè)模型,在一次循環(huán)迭代訓(xùn)練過程中執(zhí)行以下操作:
11、從所述實(shí)際狀態(tài)序列中選擇實(shí)際狀態(tài)子序列,所述實(shí)際狀態(tài)子序列中各實(shí)際狀態(tài)為世界坐標(biāo)系下的數(shù)據(jù);
12、采用狀態(tài)預(yù)測(cè)模型對(duì)目標(biāo)輸入進(jìn)行處理,得到所述實(shí)際狀態(tài)子序列中各實(shí)際狀態(tài)分別對(duì)應(yīng)的中間預(yù)測(cè)狀態(tài),并對(duì)所述中間預(yù)測(cè)狀態(tài)進(jìn)行數(shù)據(jù)變換,得到處于世界坐標(biāo)系下的目標(biāo)預(yù)測(cè)狀態(tài),所述目標(biāo)輸入至少由所述實(shí)際指令序列所確定,所述狀態(tài)預(yù)測(cè)模型中與狀態(tài)相關(guān)的輸入和輸出均為局部坐標(biāo)系下的數(shù)據(jù);
13、根據(jù)由所有所述目標(biāo)預(yù)測(cè)狀態(tài)組成的預(yù)測(cè)狀態(tài)子序列和所述實(shí)際狀態(tài)子序列,更新所述狀態(tài)預(yù)測(cè)模型。
14、第三方面,本公開提供一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理裝置執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面所述方法的步驟。
15、第四方面,本公開提供一種電子設(shè)備,包括:
16、存儲(chǔ)裝置,其上存儲(chǔ)有計(jì)算機(jī)程序;
17、處理裝置,用于執(zhí)行所述存儲(chǔ)裝置中的所述計(jì)算機(jī)程序,以實(shí)現(xiàn)上述第一方面所述方法的步驟。
18、通過上述技術(shù)方案,狀態(tài)預(yù)測(cè)模型中與狀態(tài)相關(guān)的輸入和輸出均為局部坐標(biāo)系下的數(shù)據(jù),使得模型僅關(guān)注局部運(yùn)動(dòng),將狀態(tài)預(yù)測(cè)模型輸出的局部坐標(biāo)系下的中間預(yù)測(cè)狀態(tài)進(jìn)行數(shù)據(jù)變換得到處于世界坐標(biāo)系下的目標(biāo)預(yù)測(cè)狀態(tài),在此基礎(chǔ)上,基于處于世界坐標(biāo)系下的目標(biāo)預(yù)測(cè)狀態(tài)組成的預(yù)測(cè)狀態(tài)子序列和基于處于世界坐標(biāo)系下的實(shí)際狀態(tài)子序列,進(jìn)行狀態(tài)預(yù)測(cè)模型的擬合,確保擬合得到的狀態(tài)預(yù)測(cè)模型能夠符合物理對(duì)稱性,使得狀態(tài)預(yù)測(cè)模型的預(yù)測(cè)精度不受坐標(biāo)系平移和旋轉(zhuǎn)等影響,從而提升狀態(tài)預(yù)測(cè)模型的預(yù)測(cè)精度。
19、本公開的其他特征和優(yōu)點(diǎn)將在隨后的具體實(shí)施方式部分予以詳細(xì)說明。
1.一種機(jī)器人狀態(tài)預(yù)測(cè)模型的訓(xùn)練方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述采用狀態(tài)預(yù)測(cè)模型對(duì)目標(biāo)輸入進(jìn)行處理,得到所述實(shí)際狀態(tài)子序列中各實(shí)際狀態(tài)分別對(duì)應(yīng)的中間預(yù)測(cè)狀態(tài),并對(duì)所述中間預(yù)測(cè)狀態(tài)進(jìn)行數(shù)據(jù)變換,得到處于世界坐標(biāo)系下的目標(biāo)預(yù)測(cè)狀態(tài),包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,通過以下方式初始化坐標(biāo)偏移向量:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,通過以下方式初始化目標(biāo)輸入:
5.根據(jù)權(quán)利要求1-4任一所述的方法,其特征在于,所述數(shù)據(jù)集還包括開始執(zhí)行各所述實(shí)際指令的時(shí)間戳,以及開始處于各所述實(shí)際狀態(tài)的時(shí)間戳,通過以下方式獲取所述數(shù)據(jù)集:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,在相鄰兩次采樣目標(biāo)位置中,在所述機(jī)器人到達(dá)上一次目標(biāo)位置的過程中,在所述第三預(yù)設(shè)時(shí)長(zhǎng)內(nèi)滿足第二預(yù)設(shè)條件的情況下,采樣下一目標(biāo)位置。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,在循環(huán)迭代訓(xùn)練過程中選擇的實(shí)際狀態(tài)子序列的序列長(zhǎng)度不同。
8.一種機(jī)器人狀態(tài)預(yù)測(cè)模型的訓(xùn)練裝置,其特征在于,包括:
9.一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理裝置執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述方法的步驟。
10.一種電子設(shè)備,其特征在于,包括: