版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、在信息爆炸的時(shí)代,信息過(guò)量已經(jīng)成為大家面對(duì)的一個(gè)新的問(wèn)題。人們迫切需要一些新的強(qiáng)有力的數(shù)據(jù)分析方法及工具來(lái)自動(dòng)化、智能化地將海量的數(shù)據(jù)轉(zhuǎn)化為有用的信息和知識(shí)。數(shù)據(jù)挖掘正是這樣一種技術(shù)。其中,關(guān)聯(lián)規(guī)則發(fā)現(xiàn)是數(shù)據(jù)挖掘中最重要的任務(wù)之一,它的目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)集中所有的頻繁模式和強(qiáng)關(guān)聯(lián)規(guī)則。目前,對(duì)于布爾型屬性關(guān)聯(lián)規(guī)則挖掘的研究相對(duì)比較成熟,但是對(duì)于數(shù)量型屬性關(guān)聯(lián)規(guī)則挖掘問(wèn)題還需要進(jìn)行廣泛地研究。 解決數(shù)量型關(guān)聯(lián)規(guī)則挖掘問(wèn)題的一個(gè)非常重要
2、的方法就是將其轉(zhuǎn)換為布爾型關(guān)聯(lián)規(guī)則挖掘的問(wèn)題。對(duì)于數(shù)量型屬性當(dāng)屬性全部取值是有限個(gè)數(shù)時(shí),只需將每個(gè)屬性值映射為一個(gè)布爾型屬性即可,當(dāng)屬性的取值范圍很寬時(shí),則需將其劃分成為若干個(gè)區(qū)間,然后將每個(gè)區(qū)間映射為一個(gè)布爾型屬性。然而在劃分區(qū)間時(shí)往往容易出現(xiàn)一些問(wèn)題,例如:若區(qū)間劃分過(guò)小,即區(qū)間的劃分個(gè)數(shù)過(guò)多時(shí),會(huì)造成每一個(gè)單個(gè)區(qū)間的支持度都很低;將值劃分成區(qū)間時(shí),可能會(huì)造成一些信息丟失;在處理高偏度的數(shù)據(jù)時(shí),連續(xù)屬性離散化很難有效地體現(xiàn)出數(shù)據(jù)的實(shí)
3、際分布情況;存在劃分邊界過(guò)硬的弱點(diǎn)等等。因此,對(duì)數(shù)量型關(guān)聯(lián)規(guī)則挖掘算法的研究就轉(zhuǎn)化為如何對(duì)數(shù)量型屬性定義域的合理劃分問(wèn)題。雖然已經(jīng)有人提出使用模糊集理論來(lái)解決這些問(wèn)題,但是對(duì)于算法的具體實(shí)現(xiàn)的研究仍值得不斷探索和深入。 本文先闡述了有關(guān)數(shù)據(jù)挖掘的一些主要技術(shù)以及與關(guān)聯(lián)規(guī)則相關(guān)的問(wèn)題,接著討論了模糊集合、模糊相似矩陣、模糊等價(jià)矩陣等模糊集理論的原理及特性,以基于模糊等價(jià)矩陣的模糊聚類方法為基礎(chǔ)提出了分類數(shù)不確定的FEM-TC算法,
4、描述了該算法實(shí)現(xiàn)的一般步驟;通過(guò)典型數(shù)據(jù)直接觀察法對(duì)算法的正確性與有效性進(jìn)行了驗(yàn)證;在確定了F統(tǒng)計(jì)量作為評(píng)判分類效果優(yōu)劣的標(biāo)準(zhǔn)之后又對(duì)其中的關(guān)鍵步驟,即數(shù)據(jù)規(guī)格化和構(gòu)造模糊相似矩陣,各自采用不同方法的分類結(jié)果進(jìn)行了多方面的對(duì)比分析,確定了最佳的模型。然后,以基于目標(biāo)函數(shù)的模糊ISODATA聚類方法為基礎(chǔ)提出了分類數(shù)確定的FMI算法以及檢驗(yàn)該算法分類效果的指標(biāo),描述了算法的具體實(shí)現(xiàn),同樣也使用一些典型的數(shù)據(jù)對(duì)FMI算法的正確性及有效性進(jìn)行
5、了驗(yàn)證與分析,明確了初始模糊劃分矩陣的一些特點(diǎn)。 在研究了對(duì)數(shù)量型屬性進(jìn)行分類或者區(qū)間劃分的兩種算法之后,本文又對(duì)經(jīng)典的Apriori算法進(jìn)行剖析,并在如何發(fā)現(xiàn)頻繁項(xiàng)集和生成關(guān)聯(lián)規(guī)則等方面對(duì)經(jīng)典的Apriori算法進(jìn)行了改進(jìn),即利用去尾法求子集再交叉關(guān)聯(lián),只需一次掃描數(shù)據(jù)庫(kù)即可得到滿足要求的關(guān)聯(lián)規(guī)則。之后,本文又探討了在計(jì)算支持度和置信度時(shí)如何合理使用模糊分類過(guò)程中產(chǎn)生的隸屬度的值,提出了一些新的基于模糊隸屬度的支持度與置信度的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于模糊集理論的關(guān)聯(lián)規(guī)則研究.pdf
- 基于模糊集的關(guān)聯(lián)規(guī)則及其應(yīng)用.pdf
- 基于模糊集理論的量化關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于模糊集理論的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘研究.pdf
- 基于模糊集的時(shí)序關(guān)聯(lián)規(guī)則研究與應(yīng)用.pdf
- 基于模糊集的安全事件關(guān)聯(lián)算法研究與實(shí)現(xiàn).pdf
- 基于公理模糊集的模糊決策樹(shù)算法研究.pdf
- 基于模糊集的蟻群聚類算法研究.pdf
- 基于模糊集理論的圖像增強(qiáng)算法研究.pdf
- 隨機(jī)模糊集與概率模糊集的研究.pdf
- 基于模糊理論的關(guān)聯(lián)規(guī)則挖掘算法研究.pdf
- 基于模糊集與空間信息的圖像分割算法研究.pdf
- 基于模糊集與水平集的醫(yī)學(xué)圖像自動(dòng)分割算法研究.pdf
- 基于粗糙集和模糊集理論的屬性約簡(jiǎn)算法研究.pdf
- 區(qū)間直覺(jué)模糊集的聚類算法研究.pdf
- 模糊關(guān)聯(lián)規(guī)則挖掘算法的研究.pdf
- 基于模糊關(guān)聯(lián)規(guī)則Web挖掘算法的研究.pdf
- 基于區(qū)間值模糊集的三I推理算法研究.pdf
- 基于無(wú)或言規(guī)則集的關(guān)聯(lián)規(guī)則挖掘算法研究.pdf
- 基于模糊集的不確定數(shù)據(jù)聚類算法研究.pdf
評(píng)論
0/150
提交評(píng)論