基于GPS軌跡和照片軌跡的時空數(shù)據(jù)挖掘.pdf_第1頁
已閱讀1頁,還剩116頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、現(xiàn)代信息技術(shù)和位置感知技術(shù)迅猛發(fā)展,人們能夠方便的獲得各種移動物體的軌跡數(shù)據(jù)。通過分析軌跡數(shù)據(jù)可以獲得很多有價值的信息,并且推斷出新的知識。許多基于位置推薦的門戶網(wǎng)站已經(jīng)引起了大眾和研究者的關(guān)注,關(guān)于軌跡數(shù)據(jù)挖掘的研究也逐漸變得炙手可熱。軌跡數(shù)據(jù)時時空數(shù)據(jù)的重要分支,本文主要研究了基于GPS軌跡以及照片軌跡的時空數(shù)據(jù)挖掘方法,采用多種統(tǒng)計方法挖掘軌跡之間的相似度、旅游者的行走模式等有價值的信息,通過針對真實數(shù)據(jù)進行實驗,證明了方法在實踐

2、中的高效性。
  本文的研究工作主要包含如下四個方面:
  1)提出度量GPS軌跡相似度的幾何算法(GSAs)。軌跡相似度算法能夠提煉移動軌跡之間的相似信息,這些信息在城市道路網(wǎng)、交通和地理信息系統(tǒng)中發(fā)揮著很重要的作用。首先提出LAR定義(Length-AngleRatio),用來簡化GPS軌跡并檢測其中的重點區(qū)域(sig-region);然后按照重點區(qū)域?qū)④壽E分段,分別使用向量法和面積法計算軌跡中各段之間的差異性;最后通過

3、綜合分析這些差異性得到GPS軌跡的相似度。算法的優(yōu)勢在于三方面,首先,當(dāng)GPS點缺失時,算法仍然有效;其次,GSAs應(yīng)用了真實距離,體現(xiàn)了軌跡的幾何特征,并且在以往研究的基礎(chǔ)上充分考慮了每個用戶和軌跡的獨特性以及交通網(wǎng)的特征;最后,試驗證明GSAs在精確度和時間復(fù)雜度上均優(yōu)于其它現(xiàn)有算法。
  2)提出路線還原方法,將非連續(xù)Geo照片軌跡(帶有地理位置信息的照片軌跡)還原成連續(xù)的GPS軌跡。GPS軌跡占據(jù)存儲空間大,不易處理,原始

4、Geo照片軌跡雖然易儲存,但是不能提供和GPS軌跡同樣豐富的信息,將Geo照片軌跡還原為GPS軌跡可以同時解決以上難題。本文首先提出區(qū)域興趣度比,將景點排序。然后應(yīng)用隱半馬爾可夫模型(HSMM)解釋旅游者的遷移規(guī)律,得到重要區(qū)域序列,在此基礎(chǔ)上,提出均值算法將重要區(qū)域序列還原成完整的GPS序列。最后,提出基于留一交叉檢驗(LOOCV)的試驗方法,檢驗還原路線與GPS路線的契合性,并且證明得到的連續(xù)GPS軌跡符合人群行走基本規(guī)律。

5、  3)挖掘照片軌跡的統(tǒng)計特征以及時空規(guī)律。人群行走活動的基本規(guī)律在路線規(guī)劃、目的地預(yù)測和推薦系統(tǒng)中具有舉足輕重的作用。首先,通過挖掘行走活動的共同統(tǒng)計特征,發(fā)現(xiàn)照片軌跡的一些變量符合對數(shù)正態(tài)分布,繼而服從重尾法則,這些變量包括LAR,重要區(qū)域間的距離以及用戶在重要區(qū)域的停留時間。其次,照片軌跡表現(xiàn)出高度的時空規(guī)律,本文主要從三方面來進一步研究這一問題:①重要區(qū)域間的距離符合對數(shù)正態(tài)分布的原因;②影響用戶選擇目的地的因素;⑧均方位移在照

6、片軌跡中的特征。真實數(shù)據(jù)結(jié)果證明這些共同的統(tǒng)計特征和時空規(guī)律在不同的區(qū)域中是相同的。
  4)用生存分析的方法解決軌跡問題中刪失數(shù)據(jù)的問題。已知在軌跡數(shù)據(jù)挖掘中存在刪失數(shù)據(jù)的問題,傳統(tǒng)模型不適用于這類數(shù)據(jù),需要建立相應(yīng)的刪失數(shù)據(jù)模型。照片軌跡中照片之間的時間間隔為右刪失數(shù)據(jù),本文以這一數(shù)據(jù)為例,首先用Kaplan-Meier估計建立非參數(shù)模型,研究相應(yīng)的生存模型和危險率模型。然后建立時間間隔關(guān)于拍照停留時間的Buckley-Jam

7、es模型,并且用經(jīng)驗似然的方法估計參數(shù)的置信區(qū)間。最后建立時間間隔關(guān)于拍照停留時間以及用戶個人信息的半?yún)?shù)模型,并且提出基于刪失數(shù)據(jù)的經(jīng)驗似然方法,得到經(jīng)驗似然函數(shù)比,證明漸進分布為標(biāo)準(zhǔn)卡方分布,簡化了置信區(qū)間的求解步驟。
  軌跡挖掘技術(shù)為快速發(fā)展的信息技術(shù)做出了杰出的貢獻,而迅猛發(fā)展的信息技術(shù)又為軌跡數(shù)據(jù)挖掘提供了更廣闊的發(fā)展空間,兩者相輔相成。本文提供了高效易行的方法和技術(shù),所得到的研究和技術(shù)成果并不僅僅可局限于軌跡數(shù)據(jù)挖掘

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論