機器學(xué)習(xí)與數(shù)據(jù)挖掘-drivehq_第1頁
已閱讀1頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、機器學(xué)習(xí)與數(shù)據(jù)挖掘,基本問題,何為機器學(xué)習(xí)、數(shù)據(jù)挖掘?,計算機的功能替代人的大腦進行思維最簡單的:+-*/……稍復(fù)雜:圓、方、直線……按規(guī)則推理傳統(tǒng)的人工智能更復(fù)雜的思維能力?學(xué)習(xí)、綜合、推廣、創(chuàng)新……?用計算機全面替代人的大腦進行思維是計算機學(xué)界的終極理想,何為機器學(xué)習(xí)、數(shù)據(jù)挖掘?,計算機的功能計算機“思維”水平的現(xiàn)狀人類已深刻理解的過程使用準(zhǔn)確的數(shù)學(xué)模型進行計算各種運算:+ - * / sin log……邊

2、緣提取:各種算子幾何形狀提?。篐ough 變換,y=ax+b,,,,,,X,Y,A,B,,,a,b,,,,,,,,,,,,何為機器學(xué)習(xí)、數(shù)據(jù)挖掘?,計算機的功能計算機“思維”水平的現(xiàn)狀人類尚未深刻理解的過程?尚未有好的辦法解決人類是如何解決的??學(xué)習(xí)?如果計算機可如人類一樣學(xué)習(xí),則可極大提高計算機應(yīng)用范圍和效果機器學(xué)習(xí),何為機器學(xué)習(xí)、數(shù)據(jù)挖掘?,何為“學(xué)習(xí)”?H. Simon: Any process by which

3、 a system improves its performanceM. Minsky: Learning is making useful changes in our mindsR. Michalsky: Learning is constructing or modifying representations of what is being experiencedL. Valiant: Learning is the pr

4、ocess of knowledge acquisition in the absence of explicit programming……,何為機器學(xué)習(xí)、數(shù)據(jù)挖掘?,學(xué)習(xí)的基本模型人類是如何學(xué)習(xí)的?基本過程:觀察?響應(yīng),熱,紅色,跳動,……,,,火,何為機器學(xué)習(xí)、數(shù)據(jù)挖掘?,學(xué)習(xí)的基本模型人類是如何學(xué)習(xí)的?學(xué)習(xí)過程的本質(zhì)是對因果律求逆,火,內(nèi)在實體:不可直接觀測,,,,因果律,熱,紅色,跳動,可觀測特征,,,,,,,,學(xué)習(xí)

5、,,意識中的實體,,何為機器學(xué)習(xí)、數(shù)據(jù)挖掘?,學(xué)習(xí)的基本模型,概念空間,特征空間,,,,,,,,,,,因果律,,物理過程,,學(xué)習(xí)過程,何為機器學(xué)習(xí)、數(shù)據(jù)挖掘?,學(xué)習(xí)的基本模型基本要素問題:所需要的輸出(類別、數(shù)值…)特征/屬性:可觀測的物理量樣本:特征組合和輸出類別的一些對應(yīng)關(guān)系,何為機器學(xué)習(xí)、數(shù)據(jù)挖掘?,學(xué)習(xí)的基本模型目標(biāo)通過對少量樣本的分析,獲得一個特征和輸出類別的一般性對應(yīng)關(guān)系?基本數(shù)學(xué)模型強:給定一組{(X, F

6、(X))},求F如不對F進行很強的限制,一般難以實現(xiàn)弱:給定一組{(X, F(X))},對新的X,求F(X)“舉一反三”仍然是很難的問題,何為機器學(xué)習(xí)、數(shù)據(jù)挖掘?,學(xué)習(xí)的基本模型應(yīng)用過程,原始數(shù)據(jù),人工分析,機器學(xué)習(xí),訓(xùn)練樣本,模型,新數(shù)據(jù),,,,,,,,,結(jié)果,,離線過程,在線過程,,數(shù)學(xué)方法,,決定性步驟尚無有效的理論指導(dǎo),機器學(xué)習(xí)與數(shù)據(jù)挖掘研究內(nèi)容,樣本準(zhǔn)備對象分割對象在文檔中可能只占很小比例用整個文檔提取的特征

7、含有大量噪聲特征與特征提取使用什么樣的特征?如何計算?如何進行預(yù)處理?……樣本選擇正負(fù)樣本數(shù)可能嚴(yán)重失衡(1:10,1:100)樣本可能包含噪聲,機器學(xué)習(xí)與數(shù)據(jù)挖掘研究內(nèi)容,樣本預(yù)處理特征選擇并非所有特征都對學(xué)習(xí)有幫助過多的特征會帶來大量噪聲特征降維消除特征之間的相關(guān)性,降低特征維數(shù)過多的特征會帶來大量噪聲,機器學(xué)習(xí)與數(shù)據(jù)挖掘研究內(nèi)容,訓(xùn)練算法算法選擇概率的/幾何的?產(chǎn)生式/區(qū)分式?……參數(shù)選擇算法參

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論