版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一些機率與統(tǒng)計的概念,黃文璋國立高雄大學(xué)應(yīng)用數(shù)學(xué)系,2,1. 前言,宇宙的運轉(zhuǎn),穿插著必然性及隨機性。銅板以自由落體方式落下。 ◇高度固定,落地所需時間為定值(必然性) 。 ◇那一面朝上?無法預(yù)知(隨機性)。必然性:下次日蝕、月蝕、哈雷慧星來?隨機性:颱風(fēng)走向?,3,數(shù)學(xué)裡多半是必然性的問題: ◇ 0.3+0.2=0.5, ◇三角形內(nèi)角和必為180°,
2、 ◇ ,當(dāng) ,無非零整數(shù)解。統(tǒng)計裡多半是隨機性的問題, ◇一成不變就非隨機, ◇連機率值都可能改變。,4,在隨機世界裡,不能以數(shù)學(xué)中的必然性來思考問題。物理學(xué)裡用到不少數(shù)學(xué),但學(xué)物理主要不是在學(xué)數(shù)學(xué)。從機率與統(tǒng)計的課程裡,是要學(xué)到隨機性,而非只欣賞數(shù)學(xué)。,5,在隨機世界裡,我們接觸到的是 數(shù)據(jù)(data),在必然世界裡,我們接觸到的是
3、 數(shù)字(number)。,6,數(shù)據(jù)是有內(nèi)涵包含資訊的數(shù)字。2.29與1.16為兩個數(shù)字,並未顯示任何資訊。 臺灣地區(qū)民國70年之出生率為 2.29%,民國90年之出生率為1.16%,此二數(shù)據(jù)除了含有一些資訊(如二十年來出生率下降等)外,我們可能會想到諸如 ◇如何求出? ◇是否正確? ◇學(xué)校會不會招不到學(xué)生? 而不是單純地視為兩個數(shù)字。,7,數(shù)字是數(shù)學(xué)上的問題, 數(shù)據(jù)是統(tǒng)計上的問題。
4、數(shù)字是一成不變, 數(shù)據(jù)就會有變異(variation)。,8,什麼是data? ◇資料、數(shù)據(jù),從調(diào)查、實驗或研究中獲 得資訊。 ◇ A general term for observations and measurements collected during any type of scientific investigation 。,9,
5、在Conan Doyle 著 The Celebrated Cases of Sherlock Holmes(福爾摩斯) The Adventure of the Copper Beeches一章 中: Data! data! data! he cried impatiently. I can't make bricks without clay.,10,做決策不能
6、沒有data,算命者所倚賴的也是data: ◇要收集很多人的命運, 並按面相、八字 等分類。算命是在做統(tǒng)計實務(wù)。 我們常說讓數(shù)據(jù)說話。但是否真能了解數(shù)據(jù)所說的話呢?,11,,12,你交了一新朋友。問他“有幾個小孩”,他說“有兩個”。問他“有女孩嗎?”他答“有”。問:他亦有一男孩之機率為何?解.兩個小孩的性別: 男男、男女、女男、女女。 已知有一女孩: 男女、女男、
7、女女。 會有男孩: 男女,女男。 另一小孩為男孩之機率為2/3, 另一小孩為女孩之機率為1/3。,13,很多人不相信此結(jié)果,以模擬來說明。產(chǎn)生1,000,000組(i, j),i , j=0,1。 1表女孩,0表男孩。 無女孩:250,820組, 有女孩:749,180組, 有二女孩:249,131組。,14,回答“沒有”
8、 兩個小孩皆為男孩。若問“有男孩嗎?” 回答“有” 另一個小孩為女孩之機率亦為2/3。小孩是男是女的可能性皆為1/2: 事前機率。獲得一些資訊(知道其中有一女孩)後,另一小孩是男或是女的機率改變了: 事後機率。不少家庭都是兩個小孩。若知道其中一個是男孩,則猜另一個是女孩;若知其中一個為女孩,便猜另一個是男孩: 猜中的比率很容易超過一半。,1
9、5,問:不論問有男孩或有女孩,只要答“有”, 另一小孩為異性之機率皆為2/3,合理嗎?問:如果問題改為「老大是女孩嗎?」 結(jié)果有何不同?回到前述圖片,跪著那小孩是女孩之機率為何?福爾摩斯根據(jù)一些蛛絲馬跡來推測,一張清晰的圖片,是會顯示一些資訊。,16,機率的意義為何?有二銅板: 銅板 A 出現(xiàn)正面之機率為0.3, 銅板 B 出現(xiàn)正面
10、的機率為0.2。問: ◇0.3是什麼意思?丟10次會得到3次正面? 丟10,000次得到3,000次正面? ◇0.3>0.2,若二銅板各丟10次, 銅板A之正面數(shù)>銅板B? ◇兩銅板各丟一次, 得到一正面之機率為 0.3+0.2=0.5?,17,好賭是人的天性周伯通與歐陽鋒賭是否能真能把海上鯊魚全部殲滅。黃眉僧與段延慶下圍棋,為搶先手,要段延慶猜他七十歲後,兩腳足趾
11、是奇是偶。越戰(zhàn)獵鹿人中,左輪手槍裡放一子彈,兩人輪流對自己頭部發(fā)射。 問:先發(fā)射者是否較不利?,18,有位婦女很想生個女兒,她已連生7個兒子,朋友都鼓勵她再生, 因為那有運氣那麼壞的 ?賭個運氣吧! 事實上約有一半的人賭成功,約有一半的人賭失敗。這一半賭失敗者,其中有些人還會再賭一次,然後又有約一半的人賭成功。這是為什麼有很高比例的人,相信連生7個兒子後,是較容易生出一個女兒。,19,公正賭局玩法. 投擲一
12、公正銅板,正面出現(xiàn)則賭徒贏, 否則莊家贏。策略. 每次賭注加倍,直至贏一次便停止。結(jié)果. 設(shè)第一次賭注為a元,且銅板在第n次投 擲才首度出現(xiàn)正面。則 前n-1次共輸 a+2a+…+2n-2a=(2n-1 -1)a(元)。 第n次賭注 2n-1a(元)
13、 淨(jìng)贏a元。,20,玩法. 投擲一公正銅板,直至出現(xiàn)一正面才停 止,若停止是在第r次,則得2r元。期望所得.問:1. 賭徒每次玩該付莊家多少錢,此才為 一公正賭局? 2.若所得2r元改為1.95r元,有何改變?,21,大部分的人連隨機性及機率的意義都不甚了解,因此才會沈迷於賭博,猜測明牌,或懷疑開獎之公正性。賭應(yīng)只是
14、一種遊戲。去KTV唱歌、去看表演 ,都只是為了樂趣。從金錢上來看當(dāng)然都是付出。,22,賭戲?qū)€客並不公平,何以許多人一上了賭臺就下不來?情況不利 那有運氣那麼壞,該轉(zhuǎn)運了,不能就此打住。 ◇再玩若仍輸 下次更該贏了。 ◇若幸運贏了 開始翻身了。若情況有利 手氣正順,怎可停止?除非是一直輸贏不太多(此機率並不大),讓人覺得此賭戲沒趣,否則不少人不論手氣好壞,都缺乏當(dāng)機立斷的決心。,23,以投擲銅板為例
15、持續(xù)投擲一公正銅板10,000次,令,24,以布朗運動的結(jié)果來估計: 其中 Z 有 分佈, 表一標(biāo)準(zhǔn)的布朗運動。,25,仍以布朗運動的結(jié)果來估計: 當(dāng)x=0.993,機率約為,26,底下為五個模擬圖,橫軸為n, 縱軸為Sn,其中Si > 0表正面領(lǐng)先,Si < 0表反面領(lǐng)先。
16、 構(gòu)成一隨機漫步(random walk)。 注意,27,28,29,30,31,32,新聞媒體多半只報導(dǎo)有人樂透彩中大獎,或在賭場大贏的新聞。人有選擇性記憶的傾向。在賭之前向神明祈求,大部分的時候沒有效果。但若贏了,可能真覺得神明聽了自己的祈求。,33,2. 你了解隨機嗎?,民國92年1月1日起,環(huán)保署實施第二階段的塑膠袋限用政策,塑膠業(yè)者與民眾均感到困擾。中國時報92年1月1日有一則投書: 昨天筆者支
17、援採訪此則新聞, 經(jīng)“隨機採樣” 受訪者,…。 而「平口,無提把」塑膠袋可用的細(xì)節(jié)幾乎都能“隨機”答出。 …。 於是筆者又鍥而不捨的“隨機”多問了許多間店家,…。,34,隨機與隨便的意思一樣嗎?容不容易做到隨機採樣(或隨機抽樣)呢?隨機點名,會不會每次都點不同的人?,35,再引一段文字。我代替電視節(jié)目出征,站在路邊訪問經(jīng)過的路人,隨機抽樣,盡量毫不偏私地呈現(xiàn)社會大眾的心聲?!?/p>
18、 (91年4月14日中國時報39版,作者黃明堅,題目為活到一百一十四歲如何?),36,在機率裡: 事先不能預(yù)知結(jié)果的試驗,便稱隨機試驗。隨機抽樣裡,說將10個球隨機地放進(jìn)10個箱子中,此處之隨機便含有獨立及均勻分佈的意思。均勻的骰子,將撲克牌洗得很均勻。在隨機現(xiàn)象裡,均勻大致表出現(xiàn)之機率相等,而非出現(xiàn)之頻率相等。,37,例1. n個球隨機地放進(jìn)n箱中,每箱各有一球的機率: ◇n=2,約1/2;
19、 ◇n=3,約2/9; ◇n=10,約0.00036288。每箱各有一球,不是應(yīng)最易發(fā)生嗎?,38,取n=10。令a=每箱各有一球的機率。 恰有i空箱的機率: (i) 1空箱:45a。 (ii) 2空箱:375a。 ?第三大 (iii) 3空箱:980a。 ?最大 (iv) 4空箱:
20、(7609/8)a。 ?次大 (v) 5空箱:(2835/8)a。 ?第四大 (vi) 6空箱:(6821/144)a。 (vii) 7空箱:(311/168)a。 (viii) 8空箱:(511/40320)a。 (xi) 9空箱:a/9!。,39,在紅樓夢的第八回,賈寶玉去探望薛寶釵,正在閒聊。一語未了,忽聽外面的人
21、說:『林姑娘來了?!辉挭q未完,黛玉已搖搖擺擺的進(jìn)來,一見寶玉,便笑道:『哎喲! 我來的不巧了!』寶玉等忙起身讓坐。 寶釵笑道:『這是怎麼說?』 黛玉道:『早知他來,我就不來了?!?寶釵道:『這是什麼意思?』 黛玉道:『什麼意思呢? 來呢,一齊來,不來,一個也不來。今兒他來,明兒我來,間錯開了來,豈不天天有人來呢? 也不至太冷落,也不至太熱鬧。姐姐有什麼不解的呢?』,40,
22、從10n個有編號的球中,依序隨機取n球,每次取出後放回。會有重複的機率: ◇ n=20,約0.05; ◇ n=30,約0.098; ◇ n=300,約0.777; ◇ n→∞, 趨近至1。 隨機下的後果,往往是不均勻!,41,在電影沈默的羔羊裡: Doesn't this random scattering site seem desperately random, li
23、ke an elaboration of bad liar. 這些隨機散佈的地點,不是極度地隨機嗎? 就像差勁的騙子精心設(shè)計的謊言??雌饋黼S機,反而會像精心設(shè)計的謊言!隨機點名,很難每次點不同的人。做芝蔴餅,隨機灑,芝蔴散布不易均勻。均勻分佈並非均勻散佈!,42,43,有時我們會懷疑事件之隨機性,因看到過多的巧合。以樂透彩為例,從每期開出的6個頭獎號碼,要找到一些特殊的組合,並非太困難。,44,例2. 在42取6
24、的樂透彩裡,偶數(shù)共有21個。故6碼全為偶數(shù)之機率: 每期頭獎號碼全為偶數(shù),全為奇數(shù),全在1 至21,或全在22至42,機率約,45,6碼全為3的倍數(shù),全不為3的倍數(shù),…,每期開出的6碼中,總能找到一些有趣的現(xiàn)象。當(dāng)期數(shù)夠多後,更易從其間找到一些有趣的現(xiàn)象(如北銀樂透彩39號曾連續(xù)5期出現(xiàn))。除非經(jīng)過統(tǒng)計檢定,否則不要輕易判定號碼並非隨機地出現(xiàn)。有些我們以為不容易發(fā)生的事件,其發(fā)生的機率其實並沒有想像中
25、的小。,46,例3. 在n取r的樂透彩中,頭獎號碼會有連號的機率: 在42取6,機率: 因此看到連號不用太驚訝。問:簽注連號,中頭獎的機率是否較大?,47,例4. 對北銀發(fā)行的樂透彩,假設(shè)每期簽5注 ,連續(xù)50年,至少會中一次的機率為何?解.50年間至少中一次頭獎之機率: 50年間共簽了 5?5,200=26,000(
26、注), 佔全部注數(shù) 利息不計,共花了一百三十萬元。,48,有志者事竟成?;?0年的歲月,中頭獎之機率的確是不小。在一個人的一生中,自己或認(rèn)識的人裡,有中頭獎(或發(fā)生很特殊的事件)者,是不太稀奇的。,49,夢幻七部車民國90年12月,新開幕的京華城購物中心,推出一百名休旅車抽獎活動,每天抽10部,購物每滿2,000元可兌換一張抽獎券。一對夫婦合計抽中7部車,他們共花三百多萬元,換來1,500餘張抽獎券。
27、活動期間,共投進(jìn)十四、五萬張彩券。不知每天箱內(nèi)有多少張彩券,不易求中7部車的機率。 利用波松近似估計此機率約萬分之一。,50,從新聞的觀點,只要有一這類幸運發(fā)生皆會引起注意。一件事若發(fā)生在每個人身上的機率為百萬分之一,則臺灣兩千三百萬人,每天發(fā)生二十餘件是毫不稀奇的。,51,例5. 1986年,美國紐約時報在頭版報導(dǎo)一位名叫Adams的女士第二度贏得紐澤西州的樂透彩頭獎一百五十萬美元。1985年,她第一次得三百九十萬美元
28、。第一次中的樂透彩是39取6,中頭獎機率:第二次中的樂透彩是42取6,中頭獎機率:,52,樂透彩主辦單位說一個人一生中中兩次頭獎之機率為 約十七兆分之一。 這樣算對嗎?,53,上述計算是假設(shè)Adams兩種彩券各買一張。事實上Adams每週買好幾張且買了好幾年。若在39取6的玩法裡,每週買3張,在42取6的玩法裡,每週買5張,則每週有大於百萬分之一的機率中頭獎: 以百萬分之一計,在
29、4年(約200期)裡,一次頭獎皆未中的機率:,54,利用波松近似,中一次頭獎的機率:中兩次頭獎的機率:,55,一個人終身(以30年,1,500期計)中兩次頭獎的機率:,56,紐澤西州人口超過八百萬,若有一百萬人,每期皆如上述方式買彩券,則三十年內(nèi)該州會有人至少中兩次頭獎之機率便很大:若全美有五千萬人,每期皆以上述方式買彩券,則在4年裡,至少有一人中兩次頭獎的機率便不小了:不要小看大數(shù)的威力!,57,註.
30、 此即波松近似。,58,3. 統(tǒng)計檢定,統(tǒng)計檢定是在隨機世界裡做決策之一重要的依據(jù)。有人能分辨奶茶先加奶或茶現(xiàn)代統(tǒng)計學(xué)之創(chuàng)始者英國人費雪 (R.A. Fisher)提出下述故事:,59,在1920年代後期,某日有位女士對一群正在喝下午茶的科學(xué)家宣稱,奶茶的調(diào)製順序?qū)︼L(fēng)味有很大的影響,把茶加進(jìn)牛奶裡,和把牛奶加進(jìn)茶裡,兩者喝起來完全不同。 在座的科學(xué)家們感到可笑,他們看不出兩種混合方式的化學(xué)成分有何差異。
31、 但費雪卻認(rèn)真地設(shè)計一個實驗步驟來對這件事做檢定,包括要準(zhǔn)備多少杯奶茶,以及依照什麼順序給這位女士喝等。,60,懷孕者之尿液可使種子提前發(fā)芽中央社記者郭傳信安卡拉十九日專電)土耳其國立安卡拉大學(xué)醫(yī)學(xué)院婦科系教授庫克在專欄中表示,早在西元前二二00至二000年,藥學(xué)史極為發(fā)達(dá)的古埃及人,已能夠不靠化學(xué)藥劑即可檢驗出女性是否懷孕。 庫克說,根據(jù)至今已發(fā)現(xiàn)的古埃及紙草文獻(xiàn)記載,希望知道自己是否懷孕的婦女,必須將自己清晨即起的
32、尿液裝在一個盛有大麥種子的袋子裡,但在此同時,也必須要求另一位確定未懷孕的女性也將清晨即起的尿液裝在另一個有大麥的袋子裡。,61,庫克表示,由於女性懷孕後,體內(nèi)會較未懷孕女性產(chǎn)生更多的荷爾蒙,因此泡在懷孕女性尿液中的大麥種子容易發(fā)酵並提前發(fā)芽,即可確定懷孕,但如果兩袋的大麥種子同時發(fā)芽,則證明未懷孕。 庫克最後在文中強調(diào),現(xiàn)代科學(xué)已證實這項古老的女性懷孕檢驗法「相當(dāng)準(zhǔn)確」。 (民國90年12月20日,Yahoo!奇摩網(wǎng)站
33、),62,在費雪的故事裡,若只拿一杯奶茶讓那位女士喝,她說對先放茶或先放牛奶,會相信她真有分辨能力嗎? ◇兩次皆說對呢? ◇連續(xù)10次皆說對呢? ◇20次中錯一次呢? ◇20次中錯兩次呢? 在此分辨能力指她每杯講對的機率大於隨機猜的機率 1 / 2。我們對犯錯是有一些容忍度,但程度究竟多大,就因人、因情況而異。,63,對檢驗女性是否懷孕,一樹之果有酸甜之別,一母之子有賢愚之分。與1
34、0位未懷孕的女性比,“比賽”結(jié)果,倒入該婦女尿液的大麥,以6比4提前發(fā)芽,算不算領(lǐng)先? A, B兩支球隊,即使勢均力敵,連比十場,A隊領(lǐng)先的機率為0.377,可說很容易發(fā)生。怎樣算“提前 ”? 古埃及人如何操作,以得到可靠的推論?,64,在數(shù)學(xué)裡,一命題,一旦被證明是對的,就毫無疑問地成立。如費馬最後定理。在數(shù)學(xué)上我們可以寫 假設(shè) 為一整數(shù),且x, y, z皆不為 0(假設(shè)A),
35、 試證 xn+yn=zn無整數(shù)解(結(jié)論B)。在隨機世界裡,一件事往往不知究竟是真或是偽。,65,到底該女士能否分辨奶茶是先放奶還是先放茶,即使她20次皆說對(亂猜猜中之機率=1/220 百萬分之一) ,恐怕還是有人不信她有此能力: 平均一百萬人約有一人20次皆猜對。因此我們不會說: 試證某女士“有”分辨奶茶是先放奶還 是先放茶的能力,
36、或是: 試證某女士“無”分辨 …。,66,數(shù)學(xué)家因相信在條件A下, xn+yn=zn 無整數(shù)解是對的,於是去證明。對奶茶問題,我們相信什麼?由於該女士宣稱(也希望人家相信)她有分辨能力。因此 先假設(shè)該女士無分辨能力。然後拿20杯讓她分辨,觀察她講對幾次。先設(shè)定一能忍受的推論錯誤機率α,如0.05,或0.01等,然後求在無分辨能力的假設(shè)下,講對次數(shù)會這麼多的之機率有多大?如果機率小於α
37、(即這麼多次講對是較不尋常),則拒絕原假設(shè),否則接受原假設(shè)。,67,對一隨機現(xiàn)象, 提出猜想, 將猜想表為統(tǒng)計假設(shè), 接受或拒絕統(tǒng)計假設(shè)。 此過程稱為假設(shè)檢定, 得到的推論,稱為統(tǒng)計推論。,68,統(tǒng)計假設(shè)與一般數(shù)學(xué)中的假設(shè)不同。 ◇在數(shù)學(xué)裡: 假設(shè)x>y。
38、 並未涉及任何隨機的量,此非統(tǒng)計假設(shè)。 ◇令μ表北銀樂透彩1號出現(xiàn)在頭獎號碼中 的機率,則 為一統(tǒng)計假設(shè)。數(shù)學(xué)中的假設(shè)不須去檢驗是否為真。統(tǒng)計中的假設(shè)並不是要證明是否為真,而是要判定該接受或拒絕。,69,取一組隨機樣本,並利用此組樣本,當(dāng)做是否接受某一假設(shè)之證據(jù)。如果證據(jù)與假設(shè)所陳述的不合,或者說吻合的機率很低,便拒絕該假設(shè),否則便接受該假設(shè)。數(shù)據(jù)會說話,
39、但不論方法多好,對一統(tǒng)計假設(shè)所做的推論,是可能有錯的。數(shù)學(xué)證明不能有錯,統(tǒng)計推論允許犯錯!換一組樣本,結(jié)論可能便相反。在無法避免犯錯下,只能以較好的方法減小犯錯的機率。,70,波蘭人奈曼(J. Neyman)及英國人皮爾生 (E.S. Pearson),1933年,給出奈曼-皮爾生引理。其架構(gòu)中, ◇虛無假設(shè)(H0):通常表現(xiàn)況, ◇對立假設(shè)(Ha):表我們傾向相信,或希望
40、 它是對的。北銀樂透彩頭獎號碼中,1號出現(xiàn)的機率是否大於1/7?若傾向相信答案是肯定的,則取 H0:μ=1/7 , Ha:μ>1/7。在奶茶問題,取 H0:μ=1/2 , Ha:μ>1/2。,71,虛無假設(shè)是被保護(hù)的,除非證據(jù)夠強,否則不輕易推翻。宣佈該女士有分辨能力,將造成新聞轟動。對於現(xiàn)況不輕易推翻,會使人們在做決策時更謹(jǐn)慎: 朝令夕改非假設(shè)檢定的
41、精神!,72,假設(shè)檢定裡,多大的錯誤機率可忍受?有兩種錯誤的機率: ◇虛無假設(shè)為真卻拒絕(第一型錯誤), ◇虛無假設(shè)不真卻接受(第二型錯誤)。,73,當(dāng)樣本數(shù)固定,兩型錯誤的機率, 有一減小另一必增大。第一型錯誤較嚴(yán)重,通常的作法: ◇先控制第一型錯誤的機率不要超過某一 α值, ◇然後使第二型錯誤的機率愈小愈好。,74,在樂透彩號碼的隨機性檢定裡,先假設(shè)各號碼
42、出現(xiàn)的機率相同,再看於此假設(shè)下會出現(xiàn)這麼異常的結(jié)果之機率是否夠小,以判定該不該推翻機率相同的假設(shè)。通過檢定並不表號碼真的是隨機產(chǎn)生,只是說尚無不合;但若不通過,大約便不相信號碼為隨機產(chǎn)生。,75,統(tǒng)計假設(shè)的架構(gòu),與刑事訴訟法中的無罪推定原則(第154條)類似: 被告未經(jīng)審判證明有罪確定前, 推定其為無罪。 先相信虛無假設(shè),然後看實驗出現(xiàn)的數(shù)據(jù)合不合理。以機率大小來判定合理性。
43、若會出現(xiàn)這種數(shù)據(jù)的機率很小,便認(rèn)為不合理,由是拒絕虛無假設(shè)。,76,“虛無” 二字的由來?若做出的推論是北銀樂透彩每期頭獎號碼的出現(xiàn)符合隨機性,誰有興趣?大家有興趣的是拒絕虛無假設(shè)! ◇宣佈頭獎號碼是有公式可以算出, ◇宣佈明牌存在, ◇宣佈有某幾個號碼較容易出現(xiàn),,77,統(tǒng)計裡的推論與數(shù)學(xué)中的證明不同。假設(shè)投擲一銅板100次,皆得到正面。在合理的α下(只要α>1/2100),會拒絕
44、 H0:此為公正銅板。 但公正的銅板還是有可能(只是機率很小) 出現(xiàn)如此極端之結(jié)果。問:統(tǒng)計檢定中,α太小(如α=1/2100)是否恰 當(dāng)?,78,例6. 某大公司有一萬名員工,年終摸彩,總經(jīng)理秘書中首獎。作一檢定: H0:沒有作弊, Ha:有作弊。 在H0之下,隨機地抽
45、獎,秘書中獎機率為0.00001,只要α>0.00001,會拒絕H0。 合理嗎?全公司每一員工都不該中獎?,79,4. 人的天性有隨機性嗎?,證據(jù)顯示,一般人隨意寫的號碼不易通過隨機性的檢定。寫20個1至42的數(shù)字,奇數(shù)很可能居多。參考黃文璋、洪宛頻及羅夢娜(2002)一文。,80,民國92年4月7日起,北銀開始發(fā)行四星彩。共有正彩、前三彩、後三彩、前對彩、後對彩等五種玩法。每期從0000至9999等10,0
46、00組號碼中開出一組有序號碼。正彩玩法就是四位數(shù)全對,中獎機率為10,000分之一,中獎每注可獲獎金5,000倍。表1列出頭16期開出之號碼及正彩中獎數(shù)等資料。,81,表1 四星彩正彩中獎號碼等資料,82,總計 20,010,806 1329 33.21%,83,民眾選號極不隨機,雖千挑萬選。但16期中,只有三期獎金比例超過該有的50%。獎金比例最高的第6期,開出的號碼為281
47、6,顯然是一組大家喜歡的號碼。,84,Boland and Pawitan(1999)曾做實驗: 在初等統(tǒng)計課程中,以愛爾蘭國家樂透彩的玩法(42取6),要學(xué)生每人隨機地寫出一組頭獎號碼,如此得到234組號碼。 這234組號碼通不過隨機性的檢定。,85,第2節(jié)所提的那位記者,自行隨機採樣很可能不是真正隨機,而只是隨意罷了。欲追求明牌,所追逐的往往卻是名牌。 樂透彩除了普獎外,由中獎人均分該獎獎金。而每組號碼中獎機
48、率又相同,該簽注熱門號碼還是冷門號碼?德國的樂透彩為49取6,1993年10月16日那期共賣出6,803,090張彩券,表2給出最熱門的20組號碼。簽中頭獎,與4,000人共分獎金?,86,,87,等差數(shù)列、過去的頭獎號碼、修改過去頭獎號碼、別國頭獎號碼、與重大事件有關(guān)的號碼等,都是一般人喜歡簽注的,這些其實是名牌而非明牌。 與其追求明牌卻追成名牌,倒還不如聽天由命(隨機地選),至少結(jié)果不會更壞。問:是否電腦選號較個人選號
49、易中獎?,88,中國時報92年3月29日14版記者蔡沛恆有下述報導(dǎo)。 昨日彩券銷售額降至五億五千七百萬元,是去年底以來新低。北銀彩券部經(jīng)理楊瑞東表示,面對樂透彩銷售金額出現(xiàn)“盤跌”走勢 ,北銀確實傷透腦筋,甚至連“取消電腦選號”的方式都考慮過,後來因為影響層面過大而暫時作罷。,89,採用電腦選號可適度提升中獎率,北銀評估暫停電腦選號主要是為了增加「摃龜」機會,頭彩可以累積,買氣自然上升。 楊瑞東進(jìn)
50、一步指出,目前電腦選號比重約占六成,六億元的銷售量等於有三億六千萬元採電腦選號。換算每二億六千三百萬元的銷售額就能開出一個頭獎,與最近每期頭獎得主一到二名的實際情況相比,就能證明電腦選號果然保證每期都能開出頭獎,北銀樂彩的銷售量就欲高不易。,90,5. 大數(shù)下的迷思,機率與我們的生活息息相關(guān),但一般人對機率的含義常無法正確地掌握,對隨機世界裡的規(guī)則也就常誤解。十餘年前大家樂很風(fēng)行,賭徒藉著每期愛國獎券中獎號碼來對獎。經(jīng)常有沒簽中者對愛
51、國獎券之搖獎機率產(chǎn)生懷疑。報章雜誌遂刊登一些教導(dǎo)大家“ 正確” 了解機率的文章。,91,我們引用底下一段話,供大家參考(見趙慕嵩等 (1987))。原文一字不易: 事實上,所謂失常的機率只是在機率學(xué)中必然性的短暫現(xiàn)象,其實還是正常的。 譬如一顆六面的正方形骰子,上面有一到六的點數(shù),理論上每擲一次就應(yīng)該使得每個數(shù)字各有六分之一的出現(xiàn)機會,那麼連擲六次 ,是否 1,2,3,4,5,6等數(shù)字剛好各出現(xiàn)一次?當(dāng)然不會,可是如果
52、連擲六億次,每個點數(shù)出現(xiàn)的次數(shù)就非常接近一億次,而滿足於六分之一的理論機率。,92,如果按照理論的機率,愛券連開十五萬次獎,開出105萬組號碼,那麼00到99這一百組號碼就有可能各出現(xiàn)一萬零五百次,而接近於理論機率。 開獎次數(shù)愈多,各組號碼出現(xiàn)之相對頻率,有“很大的機會” 很接近1/100 大數(shù)法則。 但各組號碼出現(xiàn)的次數(shù)與期望次數(shù)(10,500)之差,很可能會很大。,93,以投擲銅板為例。投擲數(shù)愈多,愈不易得到正反面次數(shù)相
53、同。投擲 2n 次,正反面各出現(xiàn) n 次之機率為 以Stirling公式估計n!。當(dāng)n=100,此機率約0.08;當(dāng)n=106,此機率約萬分之5.64。,94,那再看底下一則報導(dǎo): 北銀彩券部表示,樂透彩每一次的開獎都是「獨立事件」,四十二個號碼出現(xiàn)的機率是一樣的。 若以每周開獎二次來估算,經(jīng)過五萬年,「四十二選六」所有的號碼組合(即五百二十四萬餘種)都會開出一次,每一號碼被開出的次數(shù)就會十分接近。 (91
54、年3月31日聯(lián)合報第6版,91年5月25日聯(lián)合報第6版,記者黃雯雯),95,由於樂透彩上市後,開出的號碼有所謂冷門及熱門,遂有此報導(dǎo)。此報導(dǎo)毫無變異的概念。不但不會每一組號碼都開出一次,且1至42,每一號碼被開出的次數(shù)之差異,也會隨著開獎次數(shù)之增加而變大 (較嚴(yán)謹(jǐn)?shù)恼f法是,差異會變大的機率很大),而不會十分接近。,96,人本教育札記,這是一份自認(rèn)是為評析教育政策,及解讀教育問題及理念而辦的雜誌,並曾獲三屆雜誌類金鼎獎。民國九
55、十二年二月號,特別企劃的主題是 從賭博的機率現(xiàn)象談數(shù)學(xué)教育, 其中有一篇 機率的一體兩面-既偶然又規(guī)律。,97,文中有段文字: 根據(jù)數(shù)學(xué)預(yù)測的估計值告訴我們,擲骰子一萬次,將出現(xiàn)一千六百六十七個“ 一點 ” ,出現(xiàn)比率大約為百分之十六點九。 之後 ,又有數(shù)學(xué)家做實驗,當(dāng)骰子擲超過十萬次之後,出現(xiàn)“ 一點 ”的次數(shù)大約比估計值多出五百次,但百分比只差百分之 0.五,所以我們可以推論, 擲骰子
56、的次數(shù)越多,就越接近數(shù)學(xué)的預(yù)測,這就是所謂隨機的規(guī)律。問:這一段的講法有何錯誤?,98,6. 隨機法則,隨機世界裡仍有規(guī)則可循,如大數(shù)法則、中央極限定理等,便引導(dǎo)出隨機法則。大數(shù)法則說樣本平均隨著n之增大,在某種意義下會趨近至期望值。,99,弱大數(shù)法則: 設(shè)X1, X2, …為i.i.d.,令 = 樣本平均,μ= E(X),設(shè)|μ|0,即樣本平均與期望值差異會很小的機率會很大。,100,在隨機世界裡,變異
57、存在,大數(shù)法則保證了必然性。必然性使人們願意事先好好的準(zhǔn)備:球隊挑選好教練及爭取好球員,學(xué)生設(shè)法進(jìn)入好學(xué)校。光有必然性的世界,可能會使人們對未來失去盼望,少了努力的動機。如果各球隊陣容擺出來,就可算出那一隊實力最強,穩(wěn)獲冠軍,還有人想看球嗎?,101,如果進(jìn)好大學(xué)便確保將來必定成功,還有學(xué)生要努力嗎?光有必然性的世界無法運轉(zhuǎn)。必須還有隨機性,使有變異,如此世界才能生生不息地運轉(zhuǎn)。隨機性使變異隨時可能存在,使未來充滿著
58、不確定性。因此人們: 困境時等待隨機性, 順境時想要必然性。,102,103,不論樣本數(shù)n多大,都無法保證樣本平均與期望值的差一定很小。由前面五個模擬投擲銅板一萬次的圖便可得知。不過我們知道差異會很小的機率很大。我們還可求出誤差大小的機率。一般人對誤差到底大或小,概念不是很清楚 。,104,誤差理論是高斯對機率論的主要貢獻(xiàn)。統(tǒng)計裡常要做估計,估計會有誤差,需掌握誤差的大小。 在一些條件下,高斯導(dǎo)出誤
59、差有常態(tài)分佈。 德國10馬克,以高斯為人像。,105,106,,107,中央極限定理導(dǎo)致當(dāng)樣本數(shù)n夠大,樣本平均 滿足 其中μ為觀測之期望值,σ為標(biāo)準(zhǔn)差。,108,由(1)式, n愈大, 對相同的機率, 會落在一愈窄的區(qū)間。由(2)式,對相同的機率,n愈大,樣本和 會落在一愈寬的區(qū)間。,109,問:投擲一銅板若干次,正面數(shù)出現(xiàn)比率為 50.114%, 僅比50
60、%略多,是否不足以 推翻此銅板為公正?解.結(jié)論為何與投擲數(shù) n 有關(guān)。 設(shè) 為 i.i.d. 分佈之r.v.’s。 E(X) = p,Var(X) = p(1 - p)。 欲檢定 H0:p=0.5 , Ha:p>0.5。 拒絕域為 。由中央極限定理,,110,
61、現(xiàn)觀測到 。(1) n = 13,000,000。 此值微乎其微,故拒絕H0,即認(rèn)為銅板並 非公正。,111,(2) n = 1,000,000。 若α>0.0113,則拒絕H0,否則接受H0。,112,(3) n = 10,000會如何(實際 n 不可能為10,000, 因 算至小數(shù)第5位值)?
62、 對大部分的情況下(α<0.40978),皆接受 H0。,113,50.114%與50%差異是否夠大,與投擲數(shù) n 有關(guān)! n 愈大,此差異就可能夠大, n 較小時,此差異可能不夠大。換種說法,正面數(shù)比反面數(shù)多30,000是否夠多?註. x →∞時, 其中,114,例7.(取材自Harris(1988))某次
63、選舉,有A, B二候選人,共投了N張票。選舉結(jié)果A以些微票數(shù)落敗。由於採人工計票,A認(rèn)為有可能會誤計,要求重新計票。假設(shè)選舉沒有弊端,且每一張票會被誤計之機率為 p。又設(shè)計票過程形成一獨立的試驗,而重新計票可更正所有錯誤。,115,設(shè)n1,n2為A,B二人實際該得之票數(shù)。令 X1 表 A 該得而被計為 B 之票數(shù), X2 表 B 該得而被計為 A 之票數(shù)。 假設(shè)
64、 , 。在重新計票前,A 所得之票數(shù): V1 = n1 + X2 - X1, B 所得之票數(shù)為 V2 = n2 + X1 - X2。重新計票後,A 得 n1 票,B 得 n2 票, n1 + n2 = N。,116,在重新計票前,B 領(lǐng)先的票數(shù): D = V2 - V1 = n2 - n1 – 2 (X2 - X1)。由
65、中央極限定理 又,117,故,118,設(shè)d > 0, 。則在實際 A 獲勝的假設(shè)下(即 n1 > n2),原先計票 B 領(lǐng)先超過 d 票之機率現(xiàn)設(shè)N = 13,000,000,d = 30,000??煞P之機率(即重計後 A 獲勝)小於對一些不同的 p,表3 給出上述機率??煽闯鲆P之機率微乎其微。,119,表3. d=30,000,N=13,000,000,1-Φ(z)之
66、值。,120,其次對一給定的 p ,於觀測到D=d後,可得n1之估計值 滿足當(dāng)d=30,000,N=13,000,000,表4給出一些不同的 p 之下 之值。在我們的假設(shè)下, 重新驗票,原先落後者將落後更多!,121,表4 d=30,000,N=13,000,000, 之值,122,統(tǒng)計給的結(jié)果,並非百分之百可靠,此與數(shù)學(xué)不同。話說回來,在這隨機的世界,不依據(jù)統(tǒng)計給出
67、的結(jié)果做判斷,似乎不是明智之舉。,123,對於愛國獎券那個例子中所提到的擲骰子六億次的情況。只看點數(shù)1,令Xi=1表第i次投擲得到點數(shù)1,Xi=0表第i次投擲得到其他點數(shù)。 便表投擲n次點數(shù)1出現(xiàn)的次數(shù)。因P(Xi=1)=1/6, P(Xi=0)=5/6,故,124,由(2)式,取n=6?108, 便約有0.9545之機率,落在區(qū)間 此區(qū)間半徑為18,257。 而約有0.
68、0455之機率 ,點數(shù)1出現(xiàn)之總次數(shù)不落在此區(qū)間: ◇點數(shù)1出現(xiàn)的次數(shù)不會“非常接近1億次”, ◇同理愛國獎券若開出 105萬組號碼,00至 99這100組號碼,很難各出現(xiàn)恰好10,500 次。,125,再看前述月刊中那段報導(dǎo)。由於 故約有0.9545的機率,出現(xiàn)一點的次數(shù)與期 望次數(shù)16,667之差異不超2?117.85=235.70。是樣本平均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論