版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于通信數(shù)據(jù)的移動(dòng)用戶行為分析基于通信數(shù)據(jù)的移動(dòng)用戶行為分析[摘要]認(rèn)為分析移動(dòng)用戶行為特征與分類,對(duì)移動(dòng)應(yīng)用個(gè)性化服務(wù)的改進(jìn)具有重要的參考價(jià)值?;趪?guó)內(nèi)電信運(yùn)營(yíng)商隨機(jī)抽取某市一萬移動(dòng)用戶一周的日志記錄,其中含有4萬余條通話記錄和200余萬條網(wǎng)絡(luò)請(qǐng)求,每條請(qǐng)求包含對(duì)應(yīng)的基站標(biāo)號(hào)以及基站地理位置。本研究從消費(fèi)能力、通話量、網(wǎng)絡(luò)請(qǐng)求量、位移量四個(gè)維度從這批數(shù)據(jù)中提取14種基本特征指標(biāo)。利用KMeans聚類方法將移動(dòng)用戶區(qū)分成規(guī)律通話型、隨機(jī)
2、上網(wǎng)型、居家節(jié)約型和隨機(jī)高消費(fèi)型等四類用戶模型。[關(guān)鍵詞]用戶行為分析移動(dòng)用戶研究聚類分析數(shù)據(jù)挖掘[分類號(hào)]G351引言引言隨著移動(dòng)通信技術(shù)的迅猛發(fā)展和廣泛應(yīng)用,移動(dòng)終端大量普及于民眾,也產(chǎn)生了大量用戶信息記錄,如何利用大數(shù)據(jù)來了解移動(dòng)用戶行為與習(xí)慣特征的研究不斷涌現(xiàn)。通過對(duì)移動(dòng)用戶的分析與了解,許多企業(yè)與政府部門可以依據(jù)結(jié)果提供各式各樣的服務(wù)與應(yīng)用方案。移動(dòng)用戶行為分析通常是指基于地理信息涉及用戶訪問網(wǎng)絡(luò)、通話的行為規(guī)律與活動(dòng)研究。電
3、信運(yùn)營(yíng)商通過獲取用戶訪問移動(dòng)互聯(lián)網(wǎng)、使用移動(dòng)應(yīng)用及通話的行為規(guī)律能夠有效地配置網(wǎng)絡(luò)資源并提供具有針對(duì)性的服務(wù)。近年來,針對(duì)桌面端日志挖掘的研究層出不窮,[151617]都是針對(duì)桌面端web服務(wù)的后臺(tái)日志挖掘入手,通過分析用戶訪問頁(yè)面的占比、用戶訪問的頁(yè)面順序等對(duì)用戶的行為進(jìn)行建模。而針對(duì)移動(dòng)用戶的行為分析研究則在很多方面借鑒了桌面端的研究,同時(shí)利用移動(dòng)端設(shè)備的地理位置位置記錄,挖掘出用戶移動(dòng)軌跡模式,找出軌跡中重要的位置并結(jié)合通信數(shù)據(jù)、
4、互聯(lián)網(wǎng)日志數(shù)據(jù)以及移動(dòng)應(yīng)用數(shù)據(jù)作為研究的基礎(chǔ),分析挖掘移動(dòng)用戶的需求、行為、興趣,甚至是通過預(yù)測(cè)用戶的目的地、推測(cè)用戶下一步即將到達(dá)的位置以便提供針對(duì)性的推薦服務(wù)[1,13]。傳統(tǒng)的移動(dòng)用戶軌跡分析,多數(shù)利用軟件采集仿真數(shù)據(jù),屬于細(xì)時(shí)空粒度下的數(shù)據(jù),即可以采集到用戶一天中連續(xù)時(shí)間段的位置數(shù)據(jù)。Y.Zhu等作者著眼于用戶位置數(shù)據(jù)中經(jīng)常出現(xiàn)的地點(diǎn),并根據(jù)出現(xiàn)時(shí)間來推測(cè)用戶所處的位置是家還是公司[2]。此外,S.Akoush和A.Sameh則
5、通過指定時(shí)間粒度,聚類用戶在多日同一時(shí)間段的行動(dòng)軌跡,利用稀疏數(shù)據(jù)擬合出用戶在這時(shí)間段移動(dòng)軌跡的目的[3]。研究用戶的移動(dòng)軌跡,實(shí)現(xiàn)預(yù)測(cè)用戶下一步位置目的的方法,包括利用貝葉斯算法、聚類、數(shù)據(jù)挖掘方法等。實(shí)際上,電信運(yùn)營(yíng)商服務(wù)器上的數(shù)據(jù)是粗時(shí)間粒度的,唯有請(qǐng)求通信或上網(wǎng)時(shí)才會(huì)被記錄,因此用戶位置變化是不連貫的,具有隨機(jī)性、稀疏性的特點(diǎn),不能支持用戶行為軌跡直接且連續(xù)的刻畫描述。譚均元等人提出了生活熵概念作為用戶移動(dòng)軌跡規(guī)律程度的度量[4
6、],采用了個(gè)人多天時(shí)段移動(dòng)序列的算法來彌補(bǔ)實(shí)際數(shù)據(jù)的這種不足,即通過對(duì)多天數(shù)據(jù)的分析來獲得更準(zhǔn)確的用戶移動(dòng)軌跡。S.A.Shad則結(jié)合地理信息與用戶提供的上下文語義信息來增加預(yù)測(cè)準(zhǔn)確性[5]。梁鵬等作者則透過在WAP網(wǎng)關(guān)進(jìn)行數(shù)據(jù)采集,并對(duì)數(shù)據(jù)進(jìn)行數(shù)值分析和擬合最后得到用析處理的類庫(kù)Numpy、Pas[14]等大大降低了的我們的工作難度。3特征選取特征選取本研究通過特征選取與統(tǒng)計(jì)結(jié)果來挖掘移動(dòng)用戶的特征,并利用這特征作為聚類的參數(shù),將移動(dòng)
7、用戶行為分類。本研究利用消費(fèi)能力、通話量、網(wǎng)絡(luò)請(qǐng)求量、位移量四個(gè)維度作為分析用戶行為的基礎(chǔ)。根據(jù)這四個(gè)維度的特征從該批數(shù)據(jù)中提取相關(guān)的評(píng)價(jià)指標(biāo),分別包含。消費(fèi)能力:通過客戶品牌、系統(tǒng)、話費(fèi)三種來綜合用戶的消費(fèi)階層;通話量:利用每日通話次數(shù)、通話時(shí)長(zhǎng)、每次通話時(shí)長(zhǎng)、以及各時(shí)間段通話時(shí)長(zhǎng)分布等作為用戶通話習(xí)慣的評(píng)價(jià)指標(biāo);網(wǎng)絡(luò)請(qǐng)求量:利用網(wǎng)絡(luò)請(qǐng)求次數(shù)、各時(shí)間段的網(wǎng)絡(luò)請(qǐng)求分布等統(tǒng)計(jì)結(jié)果作為描述用戶上網(wǎng)習(xí)慣的特征參數(shù);位移量:使用每日出現(xiàn)的基站數(shù)
8、、位置位移量與生活熵的統(tǒng)計(jì)和計(jì)算結(jié)果來描述用戶一天中位置變化參數(shù)。3.1消費(fèi)能力本研究通過客戶品牌、手機(jī)系統(tǒng)、話費(fèi)三種特征來綜合評(píng)價(jià),評(píng)量用戶的消費(fèi)階層。該批數(shù)據(jù)的電信運(yùn)營(yíng)商提供主要三個(gè)客戶品牌:動(dòng)感地帶、全球通和神州行,動(dòng)感地帶是面向年輕群體的客戶品牌,目標(biāo)用戶是每月月話費(fèi)值低,但是數(shù)據(jù)業(yè)務(wù)比重高的用戶。全球通則面向中高端用戶,較早地推出國(guó)際漫游和手機(jī)銀行等加值服務(wù)。神州行則是面向大眾用戶,客戶群的職業(yè)、年齡等跨度都較大,資費(fèi)注重實(shí)惠
9、、大眾化。由此可知,客戶品牌作為用戶個(gè)人消費(fèi)能力的一種特征。該批數(shù)據(jù)中,屬于“動(dòng)感地帶”客戶品牌的用戶占全部的66%,使用“全球通”的用戶占全部的13%,而“神州行”的用戶占全部的21%。因此,主要手機(jī)移動(dòng)用戶以年輕用戶為居多,并數(shù)據(jù)業(yè)務(wù)比重高的需求大。由于每個(gè)用戶移動(dòng)裝置的具體消費(fèi)型號(hào)無法取得,本研究通過該用戶手機(jī)的品牌與操作系統(tǒng)作為該用戶的手機(jī)消費(fèi)喜好參考特征之一,依據(jù)用戶使用的系統(tǒng)與品牌主要分成安卓(roid)、蘋果(iOS)、微
10、軟(Windows)、黑莓(Blackberry)以及其他(Other)。由于安卓系統(tǒng)占很大比例,而且該系統(tǒng)的手機(jī)消費(fèi)分布廣泛,因此在切分成三星(Samsung)、小米魅族,以及其他安卓(Othersofroid)。小米手機(jī)和魅族在價(jià)位及使用的用戶群方面類似,因此本研究將其歸為一類。盡管黑莓系統(tǒng)手機(jī)數(shù)量很少,但較多專業(yè)人員使用,本研究仍單獨(dú)劃為一類。經(jīng)統(tǒng)計(jì)使用系統(tǒng)的用戶比例分別為:蘋果,22.02%。微軟,2.32%。黑莓,0.25%。
11、三星,19.39%。小米魅族,7.92%。其他安卓,20.12%。其它系統(tǒng),27.93%。由此可知,多數(shù)用戶仍選用安卓與蘋果系統(tǒng)的手機(jī)。用戶在使用移動(dòng)服務(wù)的過程中,消費(fèi)主要分為三類:通話費(fèi)、流量費(fèi)和增值業(yè)務(wù)費(fèi)。本研究將這三種消費(fèi)的總和作為移動(dòng)用戶的消費(fèi)金額。統(tǒng)計(jì)發(fā)現(xiàn),用戶月話費(fèi)額的均值為51.01元,中位數(shù)為33.20元,并且半數(shù)的用戶話費(fèi)介于12.77至66.52元之間。3.2通話量利用平均每日通話次數(shù)、平均通話時(shí)長(zhǎng)、每次平均通話時(shí)長(zhǎng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于數(shù)據(jù)挖掘的移動(dòng)用戶投訴行為研究.pdf
- 移動(dòng)用戶行為分析算法與平臺(tái)研究
- 基于3G網(wǎng)絡(luò)的移動(dòng)用戶行為分析.pdf
- 移動(dòng)用戶漫游通信實(shí)現(xiàn)研究
- 基于行為分析的移動(dòng)通信用戶細(xì)分——以某地市公司移動(dòng)用戶為研究對(duì)象.pdf
- 數(shù)據(jù)挖掘在電信移動(dòng)用戶行為分析中的應(yīng)用研究.pdf
- 移動(dòng)用戶行為分析算法與平臺(tái)研究.pdf
- 基于移動(dòng)用戶行為的挖掘及推薦算法研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)用戶消費(fèi)行為模式研究與應(yīng)用.pdf
- 基于數(shù)據(jù)挖掘的移動(dòng)用戶穩(wěn)定性研究.pdf
- 移動(dòng)用戶上網(wǎng)行為審計(jì)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 移動(dòng)用戶感知數(shù)據(jù)監(jiān)控分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 移動(dòng)用戶上網(wǎng)行為分析系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 移動(dòng)用戶軌跡與行為模式挖掘方法研究.pdf
- 淺談移動(dòng)用戶界面設(shè)計(jì)
- 移動(dòng)用戶定量預(yù)測(cè)方法的研究.pdf
- 數(shù)據(jù)挖掘在移動(dòng)用戶離網(wǎng)預(yù)警分析中的應(yīng)用.pdf
- 基于電信大數(shù)據(jù)挖掘的高價(jià)值移動(dòng)用戶預(yù)測(cè)研究.pdf
- 面向移動(dòng)用戶數(shù)據(jù)的情境識(shí)別與挖掘(1)
- 基于時(shí)序分析的移動(dòng)用戶情感預(yù)測(cè)研究與應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論