有A和B兩位籃球運(yùn)動(dòng)員,都認(rèn)為自己的三分球投籃技術(shù)比對(duì)方好,誰(shuí)也不服誰(shuí)。于是兩人來(lái)了一場(chǎng)投籃友誼賽。規(guī)則很簡(jiǎn)單,固定一個(gè)投籃位置,使用同一只籃球,面對(duì)同一個(gè)籃框,在沒有任何外力干擾的情況下,兩人分別各投10次,計(jì)算命中率。
很快,比賽結(jié)束,結(jié)果出來(lái)了。A命中5次,命中率50%;B命中3次,命中率30%,依照比賽規(guī)則,A獲得了勝利。但是B很不服氣,認(rèn)為自己沒有把真正的實(shí)力發(fā)揮出來(lái),要求再加賽一輪,第 一輪不作數(shù)。A也覺得可以再加賽一輪,他要讓B輸?shù)眯姆诜?。于是,兩人又加賽了一輪,每人各投?0次。
第 二輪結(jié)果出來(lái)了,A命中6次,命中率60%,B命中了7次,命中率70%,根據(jù)這輪的結(jié)果,應(yīng)該是B獲勝。這下輪到A不干了,A說(shuō)不應(yīng)該只看第 二輪的成績(jī),應(yīng)該把兩輪的數(shù)據(jù)匯總起來(lái)作比較。A兩輪一共投籃20次,命中11次,命中率55%;而B命中10次,命中率50%,總的來(lái)說(shuō),還是A獲勝。B卻不這么認(rèn)為,B覺得既然加賽一輪,就應(yīng)該只看第 二輪的數(shù)據(jù),應(yīng)該是自己獲勝才對(duì)。
于是,現(xiàn)在有了如下的三組數(shù)據(jù)。
只看第 一輪,A獲勝;只看第二輪,B獲勝;看兩輪匯總,又是A獲勝。
那么到底應(yīng)該根據(jù)哪組數(shù)據(jù)來(lái)給出結(jié)論呢?
A和B兩人爭(zhēng)執(zhí)不下,于是一起找到了教練評(píng)理。教練看了看數(shù)據(jù),說(shuō)道:“判斷比賽誰(shuí)獲勝比較簡(jiǎn)單,看兩次的數(shù)據(jù)匯總最合理,可以判定A獲勝。但是,要說(shuō)A的投籃水平一定比B高,這個(gè)結(jié)論暫時(shí)還不好下,因?yàn)槟銈z的數(shù)據(jù)很接近,而且投籃的數(shù)量太少。這樣吧,我來(lái)組織一場(chǎng)比賽,你倆交替各投5輪,每輪20次,每人共100次,你倆誰(shuí)水平高我們就用這個(gè)數(shù)據(jù)說(shuō)話?!?/p>
于是在教練的組織下,A和B按照新規(guī)則完成了比賽,得到了以下數(shù)據(jù)。
教練拿著數(shù)據(jù),打開電腦一頓操作,然后微笑著對(duì)A和B說(shuō):根據(jù)假設(shè)檢驗(yàn)的結(jié)論,我現(xiàn)在有足夠的信心判定,A的投籃水平比B的水平要高一些。A和B都表示認(rèn)可這個(gè)結(jié)論,但齊聲問(wèn)道:什么是假設(shè)檢驗(yàn)?這么神奇,還能幫人下結(jié)論?
那么,什么是假設(shè)檢驗(yàn)?
來(lái)自百度百科的定義:
假設(shè)檢驗(yàn)(hypothesistesting),又稱統(tǒng)計(jì)假設(shè)檢驗(yàn),是用來(lái)判斷樣本與樣本、樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法。顯著性檢驗(yàn)是假設(shè)檢驗(yàn)中最常用的一種方法,也是一種最基本的統(tǒng)計(jì)推斷形式,其基本原理是先對(duì)總體的特征做出某種假設(shè),然后通過(guò)抽樣研究的統(tǒng)計(jì)推理,對(duì)此假設(shè)應(yīng)該被拒絕還是接受做出推斷。
這個(gè)定義是不是看起來(lái)晦澀難懂?其實(shí)我們對(duì)照上面的案例,就好理解了。首先理解總體和樣本的概念。在案例中,我們把某人的投籃水平看成是總體,這個(gè)總體包含了TA之前、現(xiàn)在和未來(lái)的投籃結(jié)果,那么每次比賽,都可以理解為一次抽樣,而每次比賽中投籃的次數(shù)就是一個(gè)樣本。在最新一次的比賽中,A和B的樣本數(shù)量都是100,而A的命中率44%,高于B的30%,如果單看樣本,可以說(shuō)本次比賽A比B命中率高,但我們希望通過(guò)樣本來(lái)說(shuō)明總體,也就是A和B的水平(能力)的比較,這時(shí)候下結(jié)論就需要謹(jǐn)慎了。會(huì)不會(huì)B這次的30%只是他實(shí)際能力的正常波動(dòng)呢?他的平均水平會(huì)不會(huì)更高甚至高于A呢?
我們可以通過(guò)假設(shè)檢驗(yàn)來(lái)回答我們的疑問(wèn)。
我們先給出一個(gè)假設(shè):A的水平高于B,然后來(lái)檢驗(yàn)這個(gè)假設(shè)是否成立。打開Minitab軟件,進(jìn)入“統(tǒng)計(jì)”-“基本統(tǒng)計(jì)量”-“雙比率”,把比賽數(shù)據(jù)輸入:
點(diǎn)“選項(xiàng)”,因?yàn)槲覀円獧z驗(yàn)的假設(shè)是“A水平高于B”,所以將“備擇”更改為“大于”:
點(diǎn)“確定”,返回再點(diǎn)“確定”,我們就得到了下面的一段文字。
這段文字反饋了很多信息,對(duì)于初學(xué)者而言,我們只需要看懂最后一行的P值就可以了。本案例中的P值為0.028,也就是2.8%。這個(gè)2.8%是個(gè)概率,告訴我們?nèi)绻覀兿嘈徘懊嫣岢龅募僭O(shè),即“A水平高于B”而判斷失誤的可能性為2.8%,這是個(gè)很低的概率,一般情況下,這個(gè)數(shù)低于5%時(shí)我們就可以有足夠的信心下結(jié)論了,因?yàn)榕袛噱e(cuò)誤是個(gè)低概率事件。所以,教練才會(huì)信心十足的宣布:A的投籃水平要高于B。
我們?cè)儆弥皟奢喌膮R總數(shù)據(jù)做一下假設(shè)檢驗(yàn):
得到以下的結(jié)果:
這時(shí)的P值高達(dá)50%,如此高的判斷失誤概率,難怪僅憑這些數(shù)據(jù)教練無(wú)法做出判斷。
說(shuō)到這里,相信大家對(duì)假設(shè)檢驗(yàn)有了一個(gè)基本概念了。那么,在工廠的實(shí)際工作中,假設(shè)檢驗(yàn)有哪些用武之地呢?那就有很多啦!最典型的有以下三個(gè)應(yīng)用時(shí)機(jī):
1. 判斷某些因素是否是影響結(jié)果的真因時(shí);
2. 在改善措施導(dǎo)入后確認(rèn)目標(biāo)是否達(dá)成時(shí);
3. 判斷生產(chǎn)制程是否出現(xiàn)異常而導(dǎo)致明顯偏差時(shí)。
由于篇幅所限,本文中就不展開講解假設(shè)檢驗(yàn)在工廠中的具體應(yīng)用了,想深入學(xué)習(xí)的朋友可關(guān)注優(yōu)制咨詢的精益六西格瑪系列精品課程。
——END——
版權(quán)聲明:本文為優(yōu)制咨詢精益生產(chǎn)咨詢師原創(chuàng)文章,轉(zhuǎn)載請(qǐng)注明出處。