科研社交網(wǎng)站中的學(xué)者推薦研究.pdf_第1頁
已閱讀1頁,還剩74頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Web2.0時代,社交網(wǎng)絡(luò)用戶可以自由的發(fā)布信息、交流思想,吸引了人們在該類平臺上建立社區(qū)、交流知識,由于一般社交網(wǎng)絡(luò)缺乏專業(yè)學(xué)術(shù)氛圍,2007年起出現(xiàn)了專門面向?qū)W術(shù)工作者的科研社交網(wǎng)站,如國外的ResearchGate、Academia.edu,國內(nèi)的百度學(xué)術(shù)、科研之友等。他們在網(wǎng)站中瀏覽彼此主頁、尋找感興趣的文獻(xiàn)與學(xué)者、參與學(xué)術(shù)話題討論、相互提問解答,這使得全球各領(lǐng)域科研人員能夠方便地進(jìn)行即時學(xué)術(shù)探討、尋求潛在合作機(jī)會。發(fā)現(xiàn)相似研究

2、學(xué)者與潛在合作者是科研工作者使用網(wǎng)站的重要理由之一。
  但是,科研社交網(wǎng)絡(luò)存在與大眾社交網(wǎng)絡(luò)相同的信息過載、信息不對稱的問題,基于學(xué)者的學(xué)術(shù)知識與科研合作網(wǎng)絡(luò)構(gòu)建個性化推薦模型是有效的解決手段。進(jìn)一步地,目前信息處理與檢索系統(tǒng)的一個新趨勢是對情境化數(shù)據(jù)的獲取,將其考慮進(jìn)信息處理中,有助于提高推薦精確度,緩解信息過載,更好的適應(yīng)與用戶已有歷史記錄相獨(dú)立的特殊需求。為此,本文分析了科研社交網(wǎng)站中學(xué)者的社交動機(jī),得出推薦場景差異,認(rèn)為

3、學(xué)者主要對同一研究領(lǐng)域、具有相似研究偏好的學(xué)者感興趣,并與他們建立長期的社交關(guān)系,除此外,很多學(xué)者具有情境化特征,希望尋找具有特定要求限制下的合作者,如已有研究主題的項(xiàng)目或者論文。因此,本文提出了兩個學(xué)者推薦模型,即基于相似研究興趣的學(xué)者推薦模型,和基于特定情境的合作者推薦模型。針對兩種推薦情境,本文分別設(shè)計了合理對應(yīng)的解決策略。
  在基于相似研究興趣的學(xué)者推薦模型中,本文構(gòu)造了兩個子模型:學(xué)者檔案模型與學(xué)術(shù)行為網(wǎng)絡(luò)模型。在學(xué)者

4、檔案模型中,采用語言模型,依據(jù)學(xué)者的專業(yè)、研究領(lǐng)域、研究成果等信息表征學(xué)者知識,使用基于貝葉斯分解的生成概率計算學(xué)者知識的相似度;在學(xué)術(shù)行為網(wǎng)絡(luò)模型中,通過挖掘?qū)W者學(xué)術(shù)行為網(wǎng)絡(luò)中的關(guān)系,采用Adamic-Adar方法和最短路徑方法分別測量合作者網(wǎng)絡(luò)中的學(xué)者節(jié)點(diǎn)相似度和路徑距離,從全局學(xué)術(shù)領(lǐng)域和局部研究領(lǐng)域兩個角度采用Jaccard系數(shù)表示研究學(xué)者所在單位間的合作網(wǎng)絡(luò)關(guān)系度;最后,應(yīng)用Comb策略整合以上測量,預(yù)測相似度較高的學(xué)者為推薦學(xué)

5、者。在基于特定情境下的合作者推薦模型中,本文設(shè)計了兩個標(biāo)準(zhǔn)評定潛在合作者的質(zhì)量:學(xué)者學(xué)術(shù)質(zhì)量評價與學(xué)術(shù)社會網(wǎng)絡(luò)質(zhì)量評價。在學(xué)者學(xué)術(shù)質(zhì)量評價中,同時引入情境預(yù)過濾和情境后過濾到推薦方法中,使用學(xué)者的學(xué)術(shù)成果質(zhì)量(成果數(shù)量、發(fā)表刊物級別、被引用量)、職稱、G指數(shù)來為學(xué)者的學(xué)術(shù)能力評分,對情境信息進(jìn)行預(yù)處理、提取特征詞,首先采用情境預(yù)過濾策略選出含有情境內(nèi)容特征的學(xué)者構(gòu)成初步候選合作者集,然后采用調(diào)整的潛狄利克雷分配方法對情景主題分配關(guān)鍵詞,

6、運(yùn)用Kullback-Leibler差異計算初步候選合作者集中的學(xué)者與目標(biāo)學(xué)者間的知識匹配,并將MNZ標(biāo)準(zhǔn)化后的學(xué)者學(xué)術(shù)能力評分作為匹配計算中的權(quán)重值;在學(xué)術(shù)社會網(wǎng)絡(luò)質(zhì)量評價中,構(gòu)建了多元關(guān)系網(wǎng)絡(luò),包括四種關(guān)系類型:論文合作、項(xiàng)目合作、專利合作、出席相同會議,先計算學(xué)者間四種關(guān)系的數(shù)量,再引入關(guān)系年限修正得到合作質(zhì)量評分;最后對兩項(xiàng)評分進(jìn)行整合得到合作意向評分。兩個推薦模型的具體構(gòu)建方法見于論文第四章。
  同時,為了模型應(yīng)用的清

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論