2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩53頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著高科技的飛速發(fā)展,全世界每天都有幾十億的人在使用手機(jī)、電腦和其他電子產(chǎn)品,產(chǎn)生了大量的海量數(shù)據(jù)。大數(shù)據(jù)從互聯(lián)網(wǎng)向其他領(lǐng)域急速蔓延,各行各業(yè)都已經(jīng)被數(shù)據(jù)給滲透,對(duì)于海量數(shù)據(jù)的有效處理成為目前研究的熱點(diǎn)之一。在2015年的兩會(huì)期間,李總理簽訂了國務(wù)院有關(guān)推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)的指導(dǎo)意見,給互聯(lián)網(wǎng)與傳統(tǒng)行業(yè)之間的有效結(jié)合提供了政策依據(jù)。數(shù)據(jù)挖掘的發(fā)展優(yōu)勢(shì)越來越突出,占據(jù)了互聯(lián)網(wǎng)的廣闊天地。所謂數(shù)據(jù)挖掘就是對(duì)數(shù)據(jù)庫中的數(shù)據(jù),利用一些數(shù)據(jù)處理的

2、方法,查找出在信息之間存在的內(nèi)在關(guān)系的過程。包含數(shù)理統(tǒng)計(jì)、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)等技術(shù),廣泛應(yīng)用于電信、航空公司、政府和科學(xué)領(lǐng)域中。
  粗糙集是數(shù)據(jù)挖掘的方法之一,是一種用于處理不準(zhǔn)確、含有缺省值的工具。相較于模糊集,它最突出的特點(diǎn)是不需要其他先驗(yàn)的信息,或附加的知識(shí),就可以直接處理信息,找出海量數(shù)據(jù)中的隱含知識(shí),應(yīng)用于實(shí)際生活中。在數(shù)據(jù)挖掘的過程中,屬性約簡(jiǎn)可以被看做為一個(gè)預(yù)處理的步驟,同時(shí)在粗糙集理論中占據(jù)了舉足輕重的地位。屬性

3、約簡(jiǎn)可以定義為在保證知識(shí)庫能夠有效的區(qū)別庫中含有的對(duì)象的前提下,將其中不能起到?jīng)Q定作用的屬性消去。因此,在操作之后可以有效地減少知識(shí)庫中的屬性表示,同樣也保證了對(duì)象基本信息的完整性。在將知識(shí)庫中的冗余屬性消去之后,在很大程度上降低了知識(shí)所占用的空間,有效的減少了成本支出。
  在目前的研究進(jìn)程中,將粗糙集的屬性約簡(jiǎn)分成了兩種不同的類型,一種是包含全部的信息,叫做完備知識(shí)表,另一種中含有不確定的或者空缺的信息,命名為不完備知識(shí)表。完

4、備知識(shí)表指的是在知識(shí)系統(tǒng)中所有的對(duì)象信息都是準(zhǔn)確并且全面的,現(xiàn)在對(duì)于完備知識(shí)系統(tǒng)的屬性約簡(jiǎn)探索相對(duì)來講是比較全面也比較成熟的,在現(xiàn)實(shí)的應(yīng)用中也施展出來了很大的引導(dǎo)作用。但是,實(shí)際生活中由于數(shù)據(jù)搜集設(shè)備的不可避免的誤差,或者是搜集過程中環(huán)境的影響等情況,導(dǎo)致知識(shí)系統(tǒng)中會(huì)有一些信息缺失的情況存在,原有完備知識(shí)系統(tǒng)的算法已經(jīng)不能適用于這種情況。對(duì)含有缺失信息的決策表的研究是未來科學(xué)家和學(xué)者們重點(diǎn)關(guān)注的地方。
  此外,規(guī)則獲取是粗糙集理

5、論中的一個(gè)比較實(shí)用的領(lǐng)域。隨著信息爆炸式的增長(zhǎng),企業(yè)和各種組織積累了海量的數(shù)據(jù),但是這些數(shù)據(jù)本身并不是有用的信息,在數(shù)據(jù)中的規(guī)則才是對(duì)企業(yè)做出有效決策提供幫助的信息,可以使企業(yè)在處理數(shù)據(jù)信息時(shí)有可靠的依據(jù)。因此獲取決策知識(shí)庫中的規(guī)則同樣具有實(shí)用性。
  本文對(duì)當(dāng)前學(xué)者在粗糙集中屬性約簡(jiǎn)和規(guī)則獲取中取得的研究成果進(jìn)行了學(xué)習(xí),在結(jié)合他們的基礎(chǔ)上,進(jìn)行了以下創(chuàng)新:
  (1)在不完備知識(shí)系統(tǒng)中,引入了基于粒度的差別矩陣,利用條件屬

6、性在區(qū)別對(duì)象時(shí)出現(xiàn)頻率的屬性約簡(jiǎn)思想,在粒度差別矩陣的基礎(chǔ)上,構(gòu)造了計(jì)算屬性頻率的啟發(fā)函數(shù)。以知識(shí)粒度為啟發(fā)信息,提出了新的約簡(jiǎn)算法,使得算法的時(shí)空復(fù)雜度都得到了很大幅度的降低,分別降為O(K|C‖U|)(其中K=max{|T(xi)|,xi∈U}和O(|U|),最后通過數(shù)據(jù)集進(jìn)行仿真實(shí)驗(yàn),證明了算法相較于同類算法有較高的時(shí)間效率。
  (2)介紹了LEM2規(guī)則獲取算法總有屬性-值對(duì)是在反復(fù)的被納入候選屬性-值對(duì),然后又在程序的后

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論