期刊VIP學(xué)術(shù)指導(dǎo) 符合學(xué)術(shù)規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒(méi)有后顧之憂
來(lái)源:期刊VIP網(wǎng)所屬分類:綜合論文時(shí)間:瀏覽:次
摘要:為解決內(nèi)河航道中具有不同運(yùn)動(dòng)模式的船舶軌跡識(shí)別問(wèn)題,提出一種基于寬度學(xué)習(xí)系統(tǒng)(broad learning system, BLS)的船舶軌跡分類算法。對(duì)通航區(qū)域進(jìn)行劃分并制定軌跡篩選規(guī)則以構(gòu)建標(biāo)簽矩陣。利用分段三次Hermite插值法分別從軌跡點(diǎn)記錄時(shí)間上等時(shí)距和軌跡點(diǎn)空間分布上等間距兩個(gè)角度,從原軌跡數(shù)據(jù)中進(jìn)行特征點(diǎn)坐標(biāo)的提取以構(gòu)建軌跡特征矩陣。將標(biāo)簽矩陣和軌跡特征矩陣代入BLS以實(shí)現(xiàn)分類算法的訓(xùn)練與測(cè)試。以京杭運(yùn)河淮安段交叉航道AIS數(shù)據(jù)為實(shí)例,進(jìn)行軌跡分類實(shí)驗(yàn)。結(jié)果表明,基于BLS的船舶軌跡分類算法在分類精度和訓(xùn)練耗時(shí)上均優(yōu)于基于反向傳播神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的軌跡分類算法。
關(guān)鍵詞: 內(nèi)河運(yùn)輸; 船舶軌跡; 軌跡分類; 寬度學(xué)習(xí)系統(tǒng)
作者:王顥程、左毅、李鐵山
引 言
加快內(nèi)河水運(yùn)發(fā)展已經(jīng)成為我國(guó)國(guó)家戰(zhàn)略,建成暢通、高效、平安、綠色的現(xiàn)代化內(nèi)河水運(yùn)體系勢(shì)在必行。而隨著內(nèi)河水運(yùn)的不斷發(fā)展,船舶交通量越來(lái)越大,通航飽和度逐漸升高,使得內(nèi)河通航水域海事安全監(jiān)管面臨更大挑戰(zhàn)[1]。船舶自動(dòng)識(shí)別系統(tǒng)(automatic identification system,AIS)的普及使得航運(yùn)安全監(jiān)管的研究擁有了原始數(shù)據(jù)的支持[2],使得對(duì)于船舶異常行為識(shí)別、通航量預(yù)測(cè)、船舶軌跡追蹤等方面的航跡數(shù)據(jù)分析成為可能[3],而對(duì)航跡數(shù)據(jù)進(jìn)行分析的重要環(huán)節(jié)之一即是對(duì)船舶軌跡信息的分類。
船舶軌跡分類方法主要包括機(jī)器學(xué)習(xí)算法中無(wú)監(jiān)督學(xué)習(xí)的聚類算法和有監(jiān)督學(xué)習(xí)的分類算法。在無(wú)監(jiān)督學(xué)習(xí)的聚類算法方面:MA等[4]通過(guò)利用軌跡單向距離構(gòu)建軌跡間相似度矩陣[5],提出一種基于譜聚類的船舶運(yùn)動(dòng)模式識(shí)別算法。魏照坤[6]利用最小描述長(zhǎng)度準(zhǔn)則將原始軌跡劃分為若干個(gè)子軌跡,通過(guò)簡(jiǎn)化的Hausdorff距離計(jì)算法度量了不同子軌跡段間的相似性,最后利用具有噪聲的基于密度的聚類方法(density-based spatial clustering of applications with noise, DBSCAN)[7]完成了對(duì)具有不同運(yùn)動(dòng)模式的船舶軌跡的區(qū)分。SHENG等[8]在上述方法的基礎(chǔ)上,提出一種利用綜合距離函數(shù)計(jì)算軌跡結(jié)構(gòu)相似性的DBSCAN,同樣實(shí)現(xiàn)了對(duì)具有不同運(yùn)動(dòng)特征的船舶軌跡的分類。然而,上述基于密度的聚類方法需要設(shè)置的閾值較多,且尚不能分析單條完整軌跡的運(yùn)動(dòng)特點(diǎn)。在有監(jiān)督學(xué)習(xí)的分類算法方面:劉磊等[9]提出一種軌跡間綜合距離計(jì)算方法,并結(jié)合K近鄰(K-nearest neighbor, KNN)算法完成了船舶軌跡的分類。綜合距離的計(jì)算需綜合考慮軌跡點(diǎn)坐標(biāo)、航向、航速等多種因素,還需要人為設(shè)定各因素的權(quán)值,且對(duì)原始數(shù)據(jù)的完整性及準(zhǔn)確度要求較高。CHEN等[10]將軌跡的原始數(shù)據(jù)用最小二乘三次樣條曲線近似(least-squares cubic spline curves approximation, LCSCA)表示后構(gòu)建稀疏表示分類法(sparse representation classification, SRC)的字典矩陣,根據(jù)殘差最小化原則完成了軌跡類別的判斷。LCSCA算法解決了分類算法的軌跡點(diǎn)特征矩陣維度統(tǒng)一問(wèn)題,但各軌跡近似表示后的取點(diǎn)數(shù)量會(huì)受到算法限制,且在構(gòu)建SRC的字典矩陣時(shí)每類軌跡的數(shù)量均需相同。
上述方法在實(shí)際操作中往往需要對(duì)原始數(shù)據(jù)進(jìn)行多方面的信息統(tǒng)計(jì),需要人為設(shè)置的閾值較多,對(duì)原始數(shù)據(jù)的完整性要求較高。針對(duì)以上問(wèn)題,本文提出一種基于寬度學(xué)習(xí)系統(tǒng)(broad learning system,BLS)的內(nèi)河航道船舶軌跡分類算法。首先,對(duì)研究區(qū)域進(jìn)行子區(qū)域劃分,從AIS數(shù)據(jù)庫(kù)中篩選出可用的軌跡數(shù)據(jù)并作標(biāo)記,以構(gòu)造標(biāo)簽矩陣。然后,對(duì)軌跡數(shù)據(jù)進(jìn)行特征提取。考慮到研究區(qū)域的地形、通航規(guī)則以及AIS數(shù)據(jù)上傳頻率對(duì)原始軌跡數(shù)據(jù)的影響,利用分段三次Hermite插值法分別從軌跡點(diǎn)記錄時(shí)間上等時(shí)距和軌跡點(diǎn)空間分布上等間距這兩個(gè)角度對(duì)原始軌跡數(shù)據(jù)進(jìn)行特征點(diǎn)坐標(biāo)提取并構(gòu)建軌跡特征矩陣,供分類模型選擇。為完善軌跡特征矩陣的構(gòu)建,利用特征點(diǎn)坐標(biāo)值之差定義并計(jì)算各特征點(diǎn)以圓周法表示的航跡向值。最后,切分軌跡特征矩陣及標(biāo)簽矩陣以構(gòu)成多組訓(xùn)練集和測(cè)試集樣本并代入BLS網(wǎng)絡(luò)進(jìn)行交叉驗(yàn)證,完成分類模型的訓(xùn)練與測(cè)試,從而實(shí)現(xiàn)對(duì)AIS軌跡數(shù)據(jù)的自動(dòng)分類。以京杭運(yùn)河淮安段交叉航道的AIS軌跡數(shù)據(jù)為例對(duì)所提分類算法進(jìn)行驗(yàn)證。
1 基于BLS的船舶軌跡分類算法
1.1 軌跡特征矩陣的構(gòu)建
AIS數(shù)據(jù)庫(kù)中各軌跡的數(shù)據(jù)長(zhǎng)度可能不同,因此不能直接利用原始數(shù)據(jù)構(gòu)造軌跡特征矩陣進(jìn)行分類。考慮到軌跡曲線無(wú)法用一條曲線直接表示,利用一種分段多項(xiàng)式插值法從各軌跡上提取相同數(shù)量的特征點(diǎn)以統(tǒng)一各軌跡特征向量的維度。常用的分段多項(xiàng)式插值法包括分段線性插值、三次樣條插值和分段三次Hermite插值[11]。分段線性插值簡(jiǎn)單易行,但曲線不光滑且精度不高,故不適用于針對(duì)船舶軌跡數(shù)據(jù)的插值。三次樣條插值獲得的曲線光滑度較高,但求解代價(jià)較大,精確度受端點(diǎn)導(dǎo)數(shù)條件影響,且有時(shí)會(huì)出現(xiàn)插值越界現(xiàn)象。而分段三次Hermite插值通過(guò)構(gòu)造適當(dāng)?shù)牟逯倒?jié)點(diǎn)導(dǎo)數(shù)計(jì)算方法可以有效地解決上述問(wèn)題[12],因此本文采用該插值法。為增加分類模型對(duì)于原始軌跡數(shù)據(jù)的魯棒性,分別從軌跡點(diǎn)記錄時(shí)間上等時(shí)距和軌跡點(diǎn)空間分布上等間距這兩個(gè)角度對(duì)軌跡數(shù)據(jù)進(jìn)行特征點(diǎn)提取,以構(gòu)建軌跡特征矩陣。
1.1.1 等時(shí)距提取軌跡特征點(diǎn)
等時(shí)距提取軌跡特征點(diǎn)時(shí),分段三次Hermite插值法以軌跡點(diǎn)的記錄時(shí)間(協(xié)調(diào)世界時(shí),UTC)為自變量,分別求解軌跡點(diǎn)經(jīng)度和緯度在各時(shí)間段內(nèi)的插值函數(shù)[13]。最后,將該軌跡記錄時(shí)間段均分后取得的時(shí)間數(shù)列分別代入經(jīng)度和緯度在對(duì)應(yīng)時(shí)間段內(nèi)的插值函數(shù),即可求解該軌跡等時(shí)距提取特征點(diǎn)后的各點(diǎn)坐標(biāo)值。下面以經(jīng)度的插值為例,介紹分段三次Hermite插值法的具體實(shí)現(xiàn)過(guò)程。
設(shè)某條軌跡的軌跡點(diǎn)坐標(biāo)向量為
R
=((x1,y1),(x2,y2),…,(xn,yn)),軌跡點(diǎn)記錄時(shí)間向量為
T=(t1,t2,…,tn)。其中,xi和yi分別為第i個(gè)軌跡點(diǎn)的經(jīng)度和緯度,ti為第i個(gè)軌跡點(diǎn)的記錄時(shí)間。記該軌跡上某兩個(gè)相鄰軌跡點(diǎn)的記錄時(shí)間段為[tj,tj+1],則tj、tj+1、xj、xj+1均為已知量,j=1,2,…,n-1。此外,記tj和tj+1時(shí)刻軌跡點(diǎn)的經(jīng)度對(duì)記錄時(shí)間的一階導(dǎo)數(shù)分別為vxj和vxj+1。根據(jù)分段三次Hermite插值,該時(shí)間段上的三次插值函數(shù)可設(shè)為
Xj(t)=ajt3+bjt2+cjt+dj
式中:aj、bj、cj、dj均為未知量。由于該三次多項(xiàng)式一階可導(dǎo),則有vXj(t)=dXj(t)dt=3ajt2+2bjt+cj
通過(guò)求解線性方程組:
xj=ajt3j+bjt2j+cjtj+dj
xj+1=ajt3j+1+bjt2j+1+cjtj+1+djvxj=3ajt2j+2bjtj+cjvxj+1=3ajt2j+1+2bjtj+1+cj
即可得到待定系數(shù)aj、bj、cj、dj的值。然而,由于從原始軌跡數(shù)據(jù)中無(wú)法獲得軌跡點(diǎn)經(jīng)度對(duì)時(shí)間的導(dǎo)數(shù)vxj、vxj+1,這里使用一種利用經(jīng)度數(shù)據(jù)在前后相鄰的軌跡點(diǎn)記錄時(shí)間段的一階差商進(jìn)行加權(quán)的方式對(duì)導(dǎo)數(shù)進(jìn)行近似計(jì)算[12]。
如圖1所示,對(duì)于三次插值函數(shù)的所有中間節(jié)點(diǎn)(xk,tk),k=2,3,…,n-1,記其在前后相鄰兩個(gè)軌跡點(diǎn)記錄時(shí)間段的一階差商分別為δk、δk+1,則有
δk=xk-xk-1tk-tk-1
δk+1=xk+1-xktk+1-tk
記該節(jié)點(diǎn)前后相鄰兩個(gè)時(shí)間段的權(quán)值分別為ωk、ωk+1,則有
ωk=131+tk-tk-1tk+1-tk-1
ωk+1=131+tk+1-tktk+1-tk-1
該節(jié)點(diǎn)處的一階導(dǎo)數(shù)vxk可近似計(jì)算為
vxk=
δkδk+1ωkδk+ωk+1δk+1,δkδk+1>0
0,δkδk+1≤0
由于端點(diǎn)處只能獲得一側(cè)時(shí)間段的一階差商,上述加權(quán)求解的方式不再適用,故特別令端點(diǎn)處的一階導(dǎo)數(shù)與其相鄰時(shí)間段的一階差商相等,即
vx1=δ2
vxn=δn
經(jīng)上述計(jì)算,該軌跡的經(jīng)度值在各記錄時(shí)間段的插值函數(shù)可表示為
X(t)=X1(t),t∈[t1,t2]
X2(t),t∈[t2,t3]
Xn-1(t),t∈[tn-1,tn]
同理可得緯度值在各記錄時(shí)間段的插值函數(shù):
Y(t)=Y1(t),t∈[t1,t2]
Y2(t),t∈[t2,t3]
Yn-1(t),t∈[tn-1,tn]
設(shè)該軌跡按等時(shí)距劃分的分段數(shù)為p,則提取的各特征點(diǎn)的時(shí)間值可表示為
t′m=t1+(m-1)(tn-t1)/p
式中:m=1,2,…,p+1。該軌跡按等時(shí)距提取的特征點(diǎn)坐標(biāo)向量可表示為:Rt=((X(t′1),Y(t′1)),(X(t′2), Y(t′2)),…,(X(t′p+1),Y(t′p+1)))。圖2為某軌跡數(shù)據(jù)分段數(shù)p分別取10和20時(shí)的等時(shí)距提取特征點(diǎn)效果圖。從圖2可知,等時(shí)距提取該軌跡特征點(diǎn)時(shí),分段三次Hermite插值法能夠較好地描繪出該軌跡的特征。
推薦閱讀:寫船舶管理論文能看哪些文獻(xiàn)