2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩116頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)的快速發(fā)展,各個(gè)領(lǐng)域的數(shù)據(jù)量急劇增加。不同領(lǐng)域的人們都期待著從這些大量的、雜亂無章的、強(qiáng)干擾的數(shù)據(jù)中獲得自己想要的知識(shí)。這給人類的智能信息處理能力提出了新的挑戰(zhàn),已成為當(dāng)前數(shù)據(jù)挖掘的重要研究課題之一。
  粗糙集理論與方法是數(shù)據(jù)挖掘諸多處理復(fù)雜系統(tǒng)方法中的一種有效方法,與概率論、模糊集和證據(jù)理論等其它處理不確定問題的理論和方法相比,它的優(yōu)點(diǎn)是無需提供問題所需處理的數(shù)據(jù)集之外的任何先驗(yàn)信息,對(duì)問題的描述和處理更具

2、客觀性。目前,它已被廣泛應(yīng)用在機(jī)器學(xué)習(xí)、知識(shí)獲取和模式識(shí)別等領(lǐng)域。
  經(jīng)典粗糙集理論是建立在不可分辨關(guān)系這一等價(jià)關(guān)系基礎(chǔ)上的,僅能處理所有屬性值均已知且確定的完備信息系統(tǒng)。然而,由于數(shù)據(jù)采集技術(shù)的限制、傳輸媒體的故障和一些人為因素的影響,導(dǎo)致大量的現(xiàn)實(shí)信息系統(tǒng)包含有模糊的、不精確的、不完備的數(shù)據(jù)。此時(shí),經(jīng)典粗糙集理論的應(yīng)用受限。因此,研究粗糙集的各種擴(kuò)展模型及其知識(shí)獲取方法對(duì)進(jìn)一步促進(jìn)該理論的發(fā)展和實(shí)用化有著極其重要的理論和現(xiàn)實(shí)

3、意義。
  本文以粗糙集理論為工具,以知識(shí)獲取為目的,在含有未知屬性值的不完備信息系統(tǒng)中對(duì)不可分辨關(guān)系的擴(kuò)展、上近似和下近似的擴(kuò)展定義、知識(shí)約簡方法等方面進(jìn)行了較為深入的分析和研究,同時(shí)在學(xué)習(xí)樣本不足的不完整決策表中討論了面向領(lǐng)域用戶需求的增量式正域約簡更新方法,取得了如下研究成果:
  (1)研究了廣義不可分辨關(guān)系下的上、下近似定義問題,得到了每一類廣義不可分辨關(guān)系下合適的上、下近似定義,為不完備信息系統(tǒng)的知識(shí)獲取奠定了理

4、論基礎(chǔ)。
  上、下近似的經(jīng)典定義是以不可分辨關(guān)系這一等價(jià)關(guān)系為基礎(chǔ)的,如何將其擴(kuò)展到廣義不可分辨關(guān)系下一直是一個(gè)重要的研究內(nèi)容。本文將所有可能的廣義不可分辨關(guān)系依據(jù)是否滿足自反性、對(duì)稱性和傳遞性分為8種類型,在此基礎(chǔ)上,深入分析了已有12種不同形式的上、下近似基本定義之間的相互關(guān)系,基于粗糙集近似原理,給出了每一類廣義不可分辨關(guān)系下合適的上、下近似定義。由此,進(jìn)一步對(duì)已有典型廣義不可分辨關(guān)系下的上、下近似的性質(zhì)進(jìn)行了分析,發(fā)現(xiàn)對(duì)

5、象子集的下近似會(huì)隨著屬性的減少而增大的規(guī)律。這些研究成果將有助于不完備決策表的知識(shí)約簡方法設(shè)計(jì)。(第3章)
  (2)研究了量化容差關(guān)系中容差相似度的計(jì)算和閾值的選取問題,提出了一種數(shù)據(jù)驅(qū)動(dòng)的量化容差關(guān)系模型,克服了已有典型廣義不可分辨關(guān)系在對(duì)象分類性能上的不足。
  量化容差關(guān)系模型是經(jīng)典粗糙集理論在不完備信息系統(tǒng)中的一種重要擴(kuò)展模型。但是,傳統(tǒng)的容差相似度計(jì)算方法需預(yù)先知道不完備信息系統(tǒng)中屬性值的概率分布這一先驗(yàn)知識(shí),且

6、如何選取一個(gè)合適的閾值也是一個(gè)難點(diǎn)。為此,基于數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)挖掘思想提出了一種數(shù)據(jù)驅(qū)動(dòng)的量化容差關(guān)系模型。通過統(tǒng)計(jì)所有已知屬性值出現(xiàn)的頻率,綜合考慮兩個(gè)對(duì)象的屬性值未知且相同的可能性和屬性值已知且相同的屬性所占的比重,得到一種更為客觀和合理的容差相似度計(jì)算方法。為了避免人為設(shè)定閾值而影響模型分類的效果,提出了一種數(shù)據(jù)驅(qū)動(dòng)的容差相似度閾值自主式獲取方法。分類性能對(duì)比實(shí)驗(yàn)結(jié)果表明,本文提出的數(shù)據(jù)驅(qū)動(dòng)的量化容差關(guān)系與已有典型廣義不可分辨關(guān)系相

7、比具有更加穩(wěn)定和較高的分類能力。(第4章)
  (3)研究了含未知屬性值的不完備決策表中基于廣義不可分辨關(guān)系的知識(shí)約簡問題,提出了一個(gè)保持正域不減小的啟發(fā)式屬性約簡算法和一個(gè)基于屬性重要性的分層遞階值約簡算法,為不完備決策表的決策規(guī)則獲取提供了一種有效方法。
  針對(duì)廣義不可分辨關(guān)系模型下不完備決策表的知識(shí)約簡問題,依據(jù)正域會(huì)隨著條件屬性的減少而增大的規(guī)律,以獲取更多確定性知識(shí)為目標(biāo),提出了保持分類能力不降低的知識(shí)約簡策略,

8、進(jìn)而提出了一個(gè)保持正域不減小的啟發(fā)式屬性約簡算法。通過模擬人腦分辨事物的分層遞階過程,提出了一個(gè)基于屬性重要性的分層遞階值約簡算法。實(shí)驗(yàn)結(jié)果表明,在各種廣義不可分辨關(guān)系下,與以往保持正域不變的知識(shí)約簡方法相比,采用本文提出的知識(shí)約簡方法獲取的決策規(guī)則集具有較高的和穩(wěn)定的正確識(shí)別率。這些研究成果將會(huì)進(jìn)一步推動(dòng)粗糙集理論在工業(yè)中的應(yīng)用。(第5章)
  (4)研究了學(xué)習(xí)樣本集未能覆蓋整個(gè)問題空間的不完整決策表的正域約簡問題,提出了一個(gè)屬

9、性序下的增量式正域約簡更新算法,為不完整決策表的增量式知識(shí)獲取奠定了基礎(chǔ)。
  因各種原因使得知識(shí)獲取所依賴的學(xué)習(xí)樣本集僅是問題空間的一部分樣本,對(duì)應(yīng)的決策表系統(tǒng)被稱為不完整決策表。本文就該類不完整決策表,考慮不同領(lǐng)域用戶對(duì)知識(shí)獲取有著不同的需求和興趣,基于分辨矩陣元素集,提出了一個(gè)屬性序下的增量式正域約簡更新算法。實(shí)驗(yàn)結(jié)果表明,與非增量式正域約簡算法相比,采用本文提出的基于屬性序的增量式正域約簡更新方法,可以有效地提高正域約簡的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論