數據倉庫與數據挖掘 復習題_第1頁
已閱讀1頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數據倉庫與數據挖掘教程期末復習題1、數據挖掘來源于機器學習機器學習。2、數據倉庫是面向主題的面向主題的、集成的集成的、穩(wěn)定的穩(wěn)定的、不同時間的不同時間的數據集合,用于支持經營管理中決策制定支持經營管理中決策制定過程。3、元數據描述了數據倉庫的數據數據和環(huán)境環(huán)境,遍及數據倉庫的所有方面,是整個數據倉庫的核心。4、Codd將數據分析模型分為四類:絕對模型絕對模型、解釋模型解釋模型、思考模思考模型和公式化公式化。5、數據立方體是在所有可能組合

2、的維上維上進行分組聚集運算分組聚集運算的總和。6、數據質量數據質量是數據倉庫的成敗關鍵。7、概括分析概括分析是探索者分析過程的第一步。8、數據倉庫的物理模型設計是對邏輯模型設計邏輯模型設計的數據模型確定物理物理存儲結構存儲結構和存取方法存取方法。9、自組織網絡以ART模型模型、Kohonen模型模型為代表,用于聚類聚類。10、預測是利用歷史數據找出變化規(guī)律變化規(guī)律,建立模型建立模型,并用此模型來預測未來數據的種類種類、特征特征等。11、

3、調和數據調和數據是存儲在企業(yè)級數據倉庫和操作型數據存儲中的數據。12、SQL、SERVERSSAS提供了所有業(yè)務數據的同意整合試圖,可以作為傳統(tǒng)報表傳統(tǒng)報表和數據挖掘數據挖掘、在線分析處理在線分析處理、關鍵性能關鍵性能指示器記分卡的基礎。13、數據倉庫的概念模型數據倉庫的概念模型通常采用信息包圖法來進行設計。數據字典是數據庫中各類數據描述的集合,通常包括數據項、數據結構、數據流、數據存儲和處理過程五個部分。26、切片選定多維數組的一個二

4、維子集的操作叫作切片。27、數據倉庫有哪些特點?28、ETL過程的主要步驟可以概括為哪幾主方面?29、數據分割有哪些好處?30、數據挖掘的任務有哪些?概念描述;關聯(lián)分析;分類;聚類;孤立點分析;時間序列分析;預測;31、數據挖掘和在線分析處理的聯(lián)系和區(qū)別是什么?32、什么是Aprii算法?Aprii算法的中心思想是首先通過對事務數據庫進行掃描,找出支持度不小于最小支持度的所有項目,即頻繁1項集。然后循環(huán)執(zhí)行以下三步:(1)對頻繁K項集中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論