版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、社會標注系統(tǒng)的快速發(fā)展為互聯(lián)網(wǎng)信息組織提供了新的方式。它延續(xù)了Web2.0以用戶為中心的特點,充分利用用戶知識來進行數(shù)據(jù)維護和管理。目前,越來越多的系統(tǒng)提供了對社會標注的支持。無論從支持的形式的多樣性,還是從提供的功能的強健性上來說,社會標注系統(tǒng)的不斷完善為廣大互聯(lián)網(wǎng)用戶提供了更為方便的信息組織、分享以及查詢環(huán)境。
在社會標注系統(tǒng)中,用戶可以不受約束的通過標簽來對自己關注的資源進行標注。標簽是社會標注中最為突出的特色,它不但顯
2、式地對資源內容進行語義描述,還隱式地反映著用戶的興趣偏好。其自由使用的特點讓用戶以沒有任何限制的方式來對自己感興趣的內容進行管理,因此無論什么背景的用戶都可以參與到大眾分類法的構建當中。
然而,如同一把雙刃劍,標簽的自由性也為社會標注分析帶來了很大的困難。首先,標簽的歧義性問題嚴重阻礙了系統(tǒng)中推薦、分類、檢索等功能的準確性。再次,數(shù)據(jù)空間過大的問題為進行快速、精準數(shù)據(jù)分析帶來了很大的障礙。通常而言,標簽在社會標注系統(tǒng)中以單詞或
3、詞組的形式獨立存在,但是不同的標簽會共同標注相同資源或被不同用戶同時使用,這樣就提供一種發(fā)現(xiàn)標簽之間間接關聯(lián)的方式。因此,本文就從這些關系入手進行分析來解決社會標注分析過程中由標簽所引起的一些難題。
本文首先對社會標注系統(tǒng)中的基本概念進行介紹,講解當前系統(tǒng)建模方式、系統(tǒng)應用特點以及社會標注分析過程中的一些難題等。然后,針對存在的問題提出基于連接分析和聚類的兩類算法。在基于連接分析算法中,本文對用戶以及標注行為進行打分,以尋求系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于用戶模型質量和語義聚類的標簽推薦算法研究.pdf
- 基于概念語義分析的文本聚類研究.pdf
- 基于主成份分析和類能分析的聚類方法研究.pdf
- 基于語義關系和鏈接分析的疾病知識提取研究.pdf
- 基于k-means聚類和潛在語義分析的網(wǎng)絡流量分類方法研究.pdf
- 基于網(wǎng)頁與標簽聚類的搜索方法研究.pdf
- 基于鏈接特征分析的關聯(lián)知識網(wǎng)絡的語義分層方法.pdf
- 基于標簽模糊對象聚類的搜索方法.pdf
- 基于語義和鏈接的話題跟蹤方法.pdf
- 基于語義相似度分析的軟構件聚類算法研究.pdf
- 基于聚類的離群點分析方法研究.pdf
- 基于語義和領域相關的文本聚類研究.pdf
- 基于隱私保護聚類的分析和研究.pdf
- 特定領域文本的語段分析和單詞的語義聚類研究.pdf
- 基于PLSA語義聚類的web服務發(fā)現(xiàn)方法.pdf
- 基于模糊核聚類和模糊支持向量機的多標簽分類方法研究.pdf
- 基于語義相似度的群智能文本聚類方法研究.pdf
- 基于雙聚類方法分析基因表達數(shù)據(jù)的研究.pdf
- 基于核聚類和序列分析的網(wǎng)絡入侵檢測方法的研究.pdf
- 結合概率潛在語義分析的文本譜聚類研究.pdf
評論
0/150
提交評論