版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著WWW的迅速發(fā)展,Internet上的服務器積累了大量的Web日志數(shù)據(jù),基于Web日志的使用挖掘是目前的研究熱點之一。Web使用挖掘一個多學科交叉的研究領域,涉及到數(shù)據(jù)庫技術、人工智能、神經(jīng)網(wǎng)絡、模式識別、統(tǒng)計學、模糊集、粗糙集等許多學科的理論。通過對Web日志進行挖掘,可以發(fā)現(xiàn)隱藏其中的知識和規(guī)律一用戶的訪問行為和訪問興趣,這些知識可以應用于個性化服務、Web站點系統(tǒng)改進以及商業(yè)智能等。
本文針對用戶瀏覽模式的特點,
2、就用戶瀏覽模式挖掘方法和用戶瀏覽模式挖掘應用2個方面進行了分析與研究,主要工作包括以下幾個方面:
1.首先從用戶瀏覽模式挖掘的4個方面:數(shù)據(jù)預處理、興趣瀏覽模式發(fā)現(xiàn)、瀏覽模式聚類以及用戶瀏覽模式應用研究,綜述了國內外學者的經(jīng)典的方法和最新的進展,并對相關研究成果進行詳細地整理、歸納與分析。
2.在分析用戶訪問行為的基礎上,充分考慮用戶在路徑選擇上以及在頁面上瀏覽表現(xiàn)出來的興趣,提出了用戶路徑選擇興趣度以及頁面
3、瀏覽興趣度的概念,設計了路徑選擇興趣矩陣以及頁面瀏覽興趣矩陣,并基于兩個矩陣設計了瀏覽興趣路徑挖掘算法,先通過對這兩個矩陣進行綜合瀏覽興趣度計算得到所有的瀏覽興趣子路徑,最后進行子路徑合并得到瀏覽興趣路徑。
3.考慮到不同的網(wǎng)頁可能對用戶來說具有不同的興趣度,提出使用模糊綜合評判方法來對網(wǎng)頁的興趣度進行評判,此外,用戶在網(wǎng)頁上的瀏覽時間對于分析用戶的瀏覽興趣是一個很重要的因素,為了忽略用戶瀏覽時間上的細小區(qū)別,用戶在網(wǎng)頁上
4、的瀏覽時間被刻畫成模糊語言變量來描述用戶的瀏覽興趣,實現(xiàn)了基于模糊集的用戶瀏覽模式挖掘算法,挖掘出來的瀏覽模式更符合人的推理方式。
4.提出了基于LCS的歸納化的用戶瀏覽模式的聚類方法,在聚類過程中,該方法中使用LCS算法來獲取會話之間的最長公共瀏覽序列,然后根據(jù)該公共瀏覽序列結合瀏覽興趣、路徑選擇興趣度來計算會話的相似性,同時為了減少會話的維數(shù),提高算法的效率,按照網(wǎng)站的層次結構采用歸納化的方法對用戶會話進行了歸納。
5、r> 5.設計一種基于模糊粗糙集聚類用戶瀏覽模式的方法,在該方法中,每個用戶瀏覽模式被表示成等長的模糊向量的形式,以表示該用戶訪問過的網(wǎng)頁以及瀏覽時間。在該模糊向量中,每個網(wǎng)頁的都用其模糊區(qū)域的標勢量的最大值來描述該網(wǎng)頁的特征,同時給出了模糊粗糙集環(huán)境下的瀏覽模式的相異性度量,最后通過粗糙近似方法對用戶瀏覽模式進行聚類。
6.在用戶瀏覽模式的基礎上提出了構建頻繁瀏覽興趣主干子網(wǎng)的算法,可以提取出Web網(wǎng)站被頻繁訪問的
6、主干部分,為生成3G手機應用的WAP子網(wǎng)以及網(wǎng)站經(jīng)營者的商務應用提供參考。
7.為了根據(jù)用戶的訪問興趣以提供推薦,本文實現(xiàn)了一種的利用聚類分析結果和加權關聯(lián)規(guī)則相結合進行個性化推薦的方法。在該方法中,根據(jù)用戶的興趣擴展了傳統(tǒng)的關聯(lián)關聯(lián)規(guī)則挖掘方法,考慮了用戶在網(wǎng)頁上的瀏覽時間、瀏覽頻度以及網(wǎng)頁鏈入度等因素,針對每個聚類進行加權關聯(lián)規(guī)則挖掘,計算用戶會話屬于哪個(些)聚類,再應用相對應的關聯(lián)規(guī)則進行網(wǎng)頁推薦服務。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于WAP樹棧Web用戶瀏覽模式挖掘.pdf
- 基于用戶瀏覽興趣的Web使用模式挖掘.pdf
- 匿名用戶瀏覽路徑挖掘研究與實現(xiàn).pdf
- 用戶瀏覽內容分析與用戶興趣挖掘.pdf
- 用戶訪問模式在線挖掘系統(tǒng)的應用研究.pdf
- 序列模式挖掘在Web用戶訪問序列挖掘中的應用研究.pdf
- 匿名用戶Web瀏覽特征挖掘.pdf
- 昌吉醫(yī)藥用戶消費模式挖掘及其應用研究.pdf
- 用戶瀏覽模式與頁面推薦的研究.pdf
- 基于Web的用戶訪問模式挖掘算法及其應用研究.pdf
- 移動用戶軌跡與行為模式挖掘方法研究.pdf
- 基于瀏覽行為分析的用戶興趣挖掘.pdf
- 基于Hadoop的用戶瀏覽路徑挖掘技術研究.pdf
- 面向用戶興趣的用戶瀏覽行為分析方法及應用.pdf
- 用戶移動模式挖掘的研究及應用.pdf
- 基于約束的頻繁模式挖掘方法以及應用研究.pdf
- 基于用戶瀏覽行為的深度網(wǎng)絡挖掘.pdf
- 基于用戶瀏覽興趣度的WEB挖掘.pdf
- 基于約束的頻繁模式挖掘方法以及應用研究
- 金融時間序列隱含模式挖掘方法及其應用研究.pdf
評論
0/150
提交評論