2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、在很多實際應用中,數(shù)據(jù)的類別之間存在一種自然的序關系。例如,我們用1~5星去評價一部電影,3星評價高于2星評價,而4星評價低于5星評價。和標稱數(shù)據(jù)不同,我們稱這樣一類數(shù)據(jù)為有序數(shù)據(jù)。有序數(shù)據(jù)的類別之間可以排序,但類別之間的差異卻沒有精確的定義。例如,對電影的3星評價通常被認為優(yōu)于2星評價,但是3星究竟比2星好多少卻難以度量。預測有序數(shù)據(jù)的序的學習問題,稱之為序回歸。序回歸有著廣泛的實際應用場景,例如情感分析、信息檢索、推薦系統(tǒng)、信用評價

2、、醫(yī)學等。
  序回歸問題作為機器學習、數(shù)據(jù)挖掘領域重要的問題之一,越來越受到研究者們的關注。已有的工作主要集中在研究有監(jiān)督序回歸問題。然而,當缺少足夠的有標簽數(shù)據(jù)時,該問題變得難以處理。在很多實際應用中,有標簽數(shù)據(jù)往往難以獲取并且校對起來代價很高。而無標簽數(shù)據(jù)通常大量存在,并且易于獲得。因此,同時考慮有標簽數(shù)據(jù)和無標簽數(shù)據(jù)的半監(jiān)督序回歸問題具有重要的研究意義和實際價值。本文以此為動機,對半監(jiān)督序回歸問題做了一定的研究和討論。

3、r>  本文提出了一種基于加權核判別分析的半監(jiān)督序回歸技術。該算法通過一個加權策略來引入無標簽數(shù)據(jù),而權重體現(xiàn)了不同訓練數(shù)據(jù)對于類分布的貢獻大小。通過同時使用有標簽數(shù)據(jù)和無標簽數(shù)據(jù),可以更準確地估計類的分布信息,從而獲得更好的投影向量和閾值。該投影向量將原始數(shù)據(jù)映射到一個一維的空間,使得相鄰類別之間可以分隔開、相同類別的數(shù)據(jù)可以聚合緊,同時保持正確的序關系;閾值用來預測新樣例的序。該算法使用一種標簽傳播的方法來計算權重。然而,由于標簽傳

4、播算法沒有考慮數(shù)據(jù)中的序信息,導致估計的權重有時不是很準確。為了更準確地估計類的分布信息并進一步提升性能,我們提出了改進的算法——基于演化算法的半監(jiān)督序回歸技術。該算法通過使用演化算法來優(yōu)化無標簽數(shù)據(jù)的權重,優(yōu)化目標是使學習器擁有良好的學習性能和泛化能力。由于同時引入了無標簽數(shù)據(jù)和序信息,所以該問題是一個非凸且不可導的優(yōu)化問題。演化算法適用于處理這類問題,我們在本文使用差分進化算法。為了降低優(yōu)化問題的維度,本文提出了一種權重更新規(guī)則和個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論