2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩112頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、近年來,隨著移動互聯(lián)網(wǎng)應(yīng)用的迅猛發(fā)展,如何對智能手機、掌上電腦、IPAD等移動設(shè)備產(chǎn)生的豐富數(shù)據(jù)進行挖掘,已成為數(shù)據(jù)挖掘領(lǐng)域的一個研究熱點。移動數(shù)據(jù)挖掘在各種基于位置的服務(wù)中有著廣泛應(yīng)用,如早期預(yù)警系統(tǒng)、交通流量規(guī)劃、城市計算、移動營銷、社交網(wǎng)絡(luò)等。在這些應(yīng)用中,通常需要根據(jù)用戶的移動歷史記錄進行移動用戶建模,獲取其行為模式,如用戶的歷史訪問地點、偏好信息以及情境信息等,其中地點信息是理解用戶行為模式的最基本要素。本文深入研究了移動用戶

2、軌跡和行為模式挖掘方法。為此,本文基于一個統(tǒng)一的框架,提出了地點位置的坐標(biāo)提取、用戶停留點檢測和用戶頻繁行為模式挖掘方法。在該框架中,首次提出同時利用GSM網(wǎng)絡(luò)時空數(shù)據(jù)和用戶提供的語義信息進行用戶行為建模,因此在多種基于位置的服務(wù)中有著廣泛應(yīng)用前景。
   論文的主要工作和創(chuàng)新點如下:
   1.提出一種基于空間聚類的移動數(shù)據(jù)預(yù)處理方法。該方法包括空間坐標(biāo)提取,空間離群點檢查以及缺失值填充三個部分。首先,通過Google

3、 API和MIT的開源數(shù)據(jù)集,獲取移動數(shù)據(jù)的空間坐標(biāo);然后,提出基于語義和空間進行聚類的算法,解決GSM網(wǎng)絡(luò)結(jié)構(gòu)變遷(從2G轉(zhuǎn)向3G)造成的數(shù)據(jù)異常和數(shù)據(jù)丟失問題。最后,在真實數(shù)據(jù)集上對該聚類算法進行了驗證,結(jié)果表明提出的新方法有較好的效果和較高的效率。
   2.提出利用移動用戶移動軌跡的連續(xù)性進行用戶停留點檢測的方法。首先利用GSM網(wǎng)絡(luò)的基本特性和用戶提供的語義信息解決基站震蕩的問題;其次根據(jù)用戶移動過程中軌跡中基站范圍彼此

4、重疊的特性和用戶停留的時間信息,提出了一種基于地理柵格的聚類方法進行用戶停留點檢測。在真實數(shù)據(jù)集上的實驗結(jié)果表明,與用戶標(biāo)注的地點信息作為基準(zhǔn),該方法具有81.70%的準(zhǔn)確率。
   3.提出一種基于頻繁模式挖掘的移動用戶行為模式挖掘的模型。用戶趨勢分析和行為模式挖掘是很多基于位置服務(wù)的核心。為此,本文提出了結(jié)合用戶所處的時空信息,利用頻繁模式挖掘中的前綴掃描算法進行移動用戶行為模式挖掘。并進一步利用挖掘到的行為模式進行用戶相似

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論