數(shù)據(jù)挖掘試題(150道)_第1頁
已閱讀1頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、單選題單選題1.某超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題?(A)A.關聯(lián)規(guī)則發(fā)現(xiàn)B.聚類C.分類D.自然語言處理2.以下兩種描述分別對應哪兩種對分類算法的評價標準?(A)(a)警察抓小偷,描述警察抓的人中有多少個是小偷的標準。(b)描述有多少比例的小偷給警察抓了的標準。A.PrecisionRecallB.RecallPrecisionA.PrecisionROCD.RecallROC3.

2、將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務?(C)A.頻繁模式挖掘B.分類和預測C.數(shù)據(jù)預處理D.數(shù)據(jù)流挖掘4.當不知道數(shù)據(jù)所帶標簽時,可以使用哪種技術促使帶同類標簽的數(shù)據(jù)與帶其他標簽的數(shù)據(jù)相分離?(B)A.分類B.聚類C.關聯(lián)分析D.隱馬爾可夫鏈5.什么是KDD?(A)A.數(shù)據(jù)挖掘與知識發(fā)現(xiàn)B.領域知識發(fā)現(xiàn)C.文檔知識發(fā)現(xiàn)D.動態(tài)知識發(fā)現(xiàn)6.使用交互式的和可視化的技術,對數(shù)據(jù)進行探索屬于數(shù)據(jù)挖掘的哪一類任務?(

3、A)A.探索性數(shù)據(jù)分析B.建模描述C.預測建模D.尋找模式和規(guī)則7.為數(shù)據(jù)的總體分布建模;把多維空間劃分成組等問題屬于數(shù)據(jù)挖掘的哪一類任務?(B)A.探索性數(shù)據(jù)分析B.建模描述C.預測建模D.尋找模式和規(guī)則8.建立一個模型,通過這個模型根據(jù)已知的變量值來預測其他某個變量值屬于數(shù)據(jù)挖掘的哪一類任務?(C)A.根據(jù)內(nèi)容檢索B.建模描述C.預測建模D.尋找模式和規(guī)則9.用戶有一種感興趣的模式并且希望在數(shù)據(jù)集中找到相似的模式,屬于數(shù)據(jù)挖掘哪一類

4、任務?(A)A.根據(jù)內(nèi)容檢索B.建模描述C.預測建模D.尋找模式和規(guī)則11.下面哪種不屬于數(shù)據(jù)預處理的方法?(D)A變量代換B離散化C聚集D估計遺漏值12.假設12個銷售價格記錄組已經(jīng)排序如下:5101113153550557292204215使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內(nèi)?(B)A第一個B第二個C第三個D第四個13.上題中,等寬劃分時(寬度為50),15又在哪個箱子里?(A)A第一個B第二個

5、C第三個D第四個14.下面哪個不屬于數(shù)據(jù)的屬性類型:(D)A標稱B序數(shù)C區(qū)間D相異15.在上題中,屬于定量的屬性類型是:(C)A標稱B序數(shù)C區(qū)間D相異16.只有非零值才重要的二元屬性被稱作:(C)A.數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)B.數(shù)據(jù)倉庫使用的需求在開發(fā)出去就要明確C.數(shù)據(jù)倉庫的開發(fā)是一個不斷循環(huán)的過程是啟發(fā)式的開發(fā)D.在數(shù)據(jù)倉庫環(huán)境中并不存在操作型環(huán)境中所固定的和較確切的處理流數(shù)據(jù)倉庫中數(shù)據(jù)分析和處理更靈活且沒有固定的模式32.在有關數(shù)

6、據(jù)倉庫測試下列說法不正確的是:(D)A.在完成數(shù)據(jù)倉庫的實施過程中需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要包括單元測試和系統(tǒng)測試.B.當數(shù)據(jù)倉庫的每個單獨組件完成后就需要對他們進行單元測試.C.系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的功能測試和回歸測試.D.在測試之前沒必要制定詳細的測試計劃.33.OLAP技術的核心是:(D)A.在線性B.對用戶的快速響應C.互操作性.D.多維分析34.關于OLAP的特性下面正確的是:(D)(1

7、)快速性(2)可分析性(3)多維性(4)信息性(5)共享性A.(1)(2)(3)B.(2)(3)(4)C.(1)(2)(3)(4)D.(1)(2)(3)(4)(5)35.關于OLAP和OLTP的區(qū)別描述不正確的是:(C)A.OLAP主要是關于如何理解聚集的大量不同的數(shù)據(jù).它與OTAP應用程序不同.B.與OLAP應用程序不同OLTP應用程序包含大量相對簡單的事務.C.OLAP的特點在于事務量大但事務內(nèi)容比較簡單且重復率高.D.OLAP是以

8、數(shù)據(jù)倉庫為基礎的但其最終數(shù)據(jù)來源與OLTP一樣均來自底層的數(shù)據(jù)庫系統(tǒng)兩者面對的用戶是相同的.36.OLAM技術一般簡稱為”數(shù)據(jù)聯(lián)機分析挖掘”下面說法正確的是:(D)A.OLAP和OLAM都基于客戶機服務器模式只有后者有與用戶的交互性B.由于OLAM的立方體和用于OLAP的立方體有本質(zhì)的區(qū)別.C.基于WEB的OLAM是WEB技術與OLAM技術的結(jié)合.D.OLAM服務器通過用戶圖形借口接收用戶的分析指令在元數(shù)據(jù)的知道下對超級立方體作一定的操

9、作.37.關于OLAP和OLTP的說法下列不正確的是:(A)A.OLAP事務量大但事務內(nèi)容比較簡單且重復率高.B.OLAP的最終數(shù)據(jù)來源與OLTP不一樣.C.OLTP面對的是決策人員和高層管理人員.D.OLTP以應用為核心是應用驅(qū)動的.38.設X=1,2,3是頻繁項集,則可由X產(chǎn)生__(C)__個關聯(lián)規(guī)則。A、4B、5C、6D、740.概念分層圖是__(B)__圖。A、無向無環(huán)B、有向無環(huán)C、有向有環(huán)D、無向有環(huán)41.頻繁項集、頻繁閉項

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論