
文章插圖
當(dāng)我們說到p-value時(shí),我們?cè)谡f什么?
“這個(gè)變量的p-value小于0.05,所以這個(gè)變量很重要”
……..
你真的知道自己在說什么么???這個(gè)p-value到底是個(gè)什么鬼?為什么小于0.05就很重要?很重要是什么意思?????
終于…
這次,我們通俗易懂地來講講到底什么是p-value(p值) 。
在講p-value之前,我們用擲硬幣來舉個(gè)例子 。
硬幣有正反兩面,在概率中我們知道,出現(xiàn)正反面的概率各為50%(1/2),所以作為一個(gè)正常的硬幣,如果我們投無限次后,結(jié)果一定會(huì)是正反各占50% 。但是,如果我想知道自己手中的硬幣,到底是不是正常的硬幣,有沒有做過手腳,在實(shí)際操作中是沒辦法投擲無限次的 。因此,我們只能用有限的結(jié)果來判斷“硬幣是否為常規(guī)硬幣”這個(gè)問題的答案 。
在統(tǒng)計(jì)學(xué)上,做這個(gè)檢驗(yàn)時(shí),通常會(huì)設(shè)定一個(gè)虛無假設(shè)(也叫零假設(shè),Null Hypothesis),通常記作H0 。以及一個(gè)對(duì)立假設(shè)(Alternative Hypothesis),及與虛無假設(shè)對(duì)立的假設(shè),如果證明虛無假設(shè)錯(cuò)誤,則可以推出對(duì)立假設(shè)成立 。
在擲硬幣這個(gè)例子中,我們可以設(shè)定
H0: 手中的硬幣是常規(guī)硬幣
H1: 手中的硬幣做過手腳
如果手中硬幣是常規(guī)硬幣,我們知道正面和反面出現(xiàn)的概率各為50%,所以如果我投擲10次硬幣,則正面和反面出現(xiàn)的次數(shù)各位5次 。正面5次,反面5次,就是我們對(duì)于投擲10次硬幣的期望值(expected value) 。
現(xiàn)在我們開始投擲硬幣,出現(xiàn)的是正面3次,反面7次 。這個(gè)結(jié)果就是我們對(duì)于投擲10次硬幣的觀測值(observed valued),即實(shí)際的結(jié)果 。
通過分析期望值和觀測值的差距,我們就可以判斷出硬幣是否正常 。而這個(gè)期望值和觀測值差距的判斷方法就是chi-square 。
Figure 1 chi-square計(jì)算公式
上圖即為chi-square的計(jì)算公式,O代表觀測值(observed value),E代表期望值(expected value) 。有沒有覺得這和方差的公式很像?沒錯(cuò),其實(shí)方差是一組數(shù)據(jù)與其均值的比較,而chi-suaqre是一組數(shù)據(jù)與另一組數(shù)據(jù)期望值的比較 。
那么在擲硬幣這個(gè)例子中chi-square(卡方)=(3-5)^2/5+(7-5)^2/5=1.6
Figure 2 擲硬幣實(shí)驗(yàn):觀測值與期望值對(duì)比表
算出了chi-square,那么又怎判斷檢驗(yàn)結(jié)果呢?現(xiàn)在,跟我一起把卡方分布表(見Figure 2)拿出來~
Figure 3 卡方分布表
上圖即為卡方分布表,左上角的α表示錯(cuò)誤拒絕H0假設(shè)的概率(即虛無假設(shè)事實(shí)上成立,但我們計(jì)算出的結(jié)果卻錯(cuò)誤判斷虛無假設(shè)不成立的概率) 。n代表自由度(degree of freedom),即獨(dú)立變量數(shù)減1,在這個(gè)例子中,獨(dú)立變量數(shù)為2(正面和反面),所以自由度為1(2-1=1) 。
當(dāng)然,你也會(huì)見到與上圖不一樣的卡方分布圖,比如Figure 3 。P代表α,即P(當(dāng)H0為真時(shí)拒絕H0)(其實(shí)就是p-value),df代表自由度(degree of freedom) 。
Figure 4 卡方分布表
假設(shè)置信度為95%,即錯(cuò)誤拒絕H0的概率為0.05 。展開解釋就是,我們有95%的概率確信檢驗(yàn)結(jié)果正確,有5%的概率會(huì)錯(cuò)誤拒絕虛無假設(shè) 。(我們總說的p值與0.05比較就是這個(gè)啦,其實(shí)不一定是0.05,根據(jù)具體情況可以設(shè)置不一樣的值,只是大部分時(shí)候都用0.05)
對(duì)照著卡方分布表(Figure 4),找到1所在的行(我們計(jì)算出的chi-square自由度是1),發(fā)現(xiàn)1.6是介于1.323和2.706之間,查表得出其p值為0.25到0.1之間,大于0.05,所以我們不能拒絕H0 。換句話說,H0成立,即硬幣是常規(guī)硬幣,沒有做手腳 。
Figure 5 卡方分布表(chi-square=1.6)
大家通過觀察卡方分布表能夠發(fā)現(xiàn),在用一個(gè)自由度下,chi-square越大,其p值就越小 。舉個(gè)極端的例子,如果在擲硬幣的例子中,我投擲10次硬幣,剛好5次正面,5次反面,則此時(shí)算是的chi-square為0(觀測值與期望值一致),這時(shí)的p-value是遠(yuǎn)大于0.095,沒有理由拒絕H0,H0假設(shè)成立,即硬幣是常規(guī)硬幣 。
以上關(guān)于本文的內(nèi)容,僅作參考!溫馨提示:如遇健康、疾病相關(guān)的問題,請(qǐng)您及時(shí)就醫(yī)或請(qǐng)專業(yè)人士給予相關(guān)指導(dǎo)!
「愛刨根生活網(wǎng)」www.malaban59.cn小編還為您精選了以下內(nèi)容,希望對(duì)您有所幫助:- 單位凈值1.023什么意思 單位凈值和累計(jì)凈值是什么意思
- 18kgp回收多少錢一克 18kgp是什么金值錢嗎
- 高密度脂蛋白膽固醇正常值范圍是多少?
- 情侶去旅游的5大爭吵地雷 價(jià)值觀差距變成導(dǎo)火線
- 另一半是否值得你付出?先看他有沒有負(fù)面情緒
- 什么書好看值得看小學(xué)
- 男朋友劈腿了怎么辦 男朋友劈腿了值得挽回嗎
- 低密度值蛋白膽固醇高有什么危害呢?
- 臨沂市高級(jí)財(cái)經(jīng)學(xué)校統(tǒng)計(jì)學(xué)
- 千萬不要買凈值型理財(cái)產(chǎn)品 業(yè)績基準(zhǔn)和七日年化的區(qū)別
