雙樣本T檢驗(yàn)和置信區(qū)間的例子
有時在統(tǒng)計中,找出問題的例子是有幫助的。這些例子可以幫助我們找出類似的問題。在本文中,我們將詳細(xì)介紹對兩種人口均值進(jìn)行推論統(tǒng)計的過程。我們不僅會看到如何對兩種總體均值的差異進(jìn)行假設(shè)檢驗(yàn),我們還將為此差異構(gòu)建置信區(qū)間。我們使用的方法有時稱為雙樣本t檢驗(yàn)和雙樣本t置信區(qū)間。
問題陳述
假設(shè)我們希望測試小學(xué)生的數(shù)學(xué)能力。我們可能有的一個問題是,更高年級的平均考試成績是否更高。
對27名三年級學(xué)生的簡單隨機(jī)樣本進(jìn)行數(shù)學(xué)測試,對他們的答案進(jìn)行評分,結(jié)果發(fā)現(xiàn)平均得分為75分,樣本標(biāo)準(zhǔn)差為3分。
對20名五年級學(xué)生的簡單隨機(jī)樣本進(jìn)行相同的數(shù)學(xué)測試,并對他們的答案進(jìn)行評分。五年級學(xué)生的平均得分為84分,樣本標(biāo)準(zhǔn)差為5分。
在這種情況下,我們提出以下問題:
- 樣本數(shù)據(jù)小學(xué)生生活小常識是否為我們提供證據(jù)表明所有五年級學(xué)生的平均考試成績超過所有三年級學(xué)生的平均考試成績?
- 三年級和五年級人群平均考試成績差異的95%置信區(qū)間是多少?
條件和程序
我們必須選擇使用哪個程序。在這樣做時,我們必須確保并檢查是否滿足此程序的條件。我們被要求比較兩種人口手段??梢杂脕碜龅竭@一點(diǎn)的一組方法是雙樣本t程序的方法。
為了使用這些t-程序?qū)τ趦蓚€樣品,我們需要確保以下條件成立:
- 我們從兩個感興趣的人群中獲得了兩個簡單的隨機(jī)樣本。
- 我們的簡單隨機(jī)樣本不占總?cè)丝诘?%。
- 這兩個樣本彼此獨(dú)立,
- 變量是正態(tài)分布的。
- 兩個總體的總體均值和標(biāo)準(zhǔn)差均未知。
我們看到大多數(shù)這些條件都得到了滿足。我們被告知我們有簡單的隨機(jī)樣本。我們正在研究的人口很多,因?yàn)檫@些年級有數(shù)百萬學(xué)生。
我們無法自動假設(shè)的條件是測試分?jǐn)?shù)是否正態(tài)分布。由于我們的樣本量足夠大,因此通過t過程的魯棒性,我們不一定需要變量正態(tài)分布。
由于條件得到滿足,我們進(jìn)行了一些初步計算。
標(biāo)準(zhǔn)錯誤
標(biāo)準(zhǔn)誤差是標(biāo)準(zhǔn)偏差的估計值。對于此統(tǒng)計信息,我們添加樣本的樣本方差,然后取平方根。這給出了公式:
(s2/n+s2/n)1/2
通過使用上面的值,我們可以看到標(biāo)準(zhǔn)錯誤的值是
(32/27+52/20)1/2=(1/3+5/4)1/2=1.2583
自由度
我們可以對我們的自由度使用保守的近似值。這可能低估了自由度的數(shù)量,但計算比使用Welch's公式要容易得多。我們使用兩個樣本中較小的一個,然后從這個數(shù)字中減去一個。
例如,兩個樣本中較小的一個是20。這意味著自由度數(shù)是20-1=19。
假設(shè)檢驗(yàn)127 128我們希望檢驗(yàn)這樣的假設(shè):五年級學(xué)生的平均考試成績大于三年級學(xué)生的平均成績。設(shè)μ為所有五年級學(xué)生人口的平均分。同樣,我們讓μ是所有三年級學(xué)生人口的平均得分。
假設(shè)如下:
- H:μ-μ=0
- H:μ-μ>0
測試統(tǒng)計量是樣本均值之間的差值,然后除以標(biāo)準(zhǔn)誤差。由于我們使用樣本標(biāo)準(zhǔn)差來估計總體標(biāo)準(zhǔn)差,因此t分布的檢驗(yàn)統(tǒng)計量。
測試統(tǒng)計量的值是(84-75)/1.2583。這大約是7.15。
我們現(xiàn)在確定這個假設(shè)檢驗(yàn)的p值是多少。我們查看測試統(tǒng)計量的值,以及它位于具有19個自由度的t分布上的位置。對于此分布,我們有4.2 x 10-7作為p值。(確定這一點(diǎn)的一種方法是使用T。DIST.RT在Excel中的功能。)
由于我們的p值很小,因此我們拒絕零假設(shè)。結(jié)論是五年級學(xué)生的平均考試成績高于三年級學(xué)生的平均考試成績。
置信區(qū)間
由于我們已經(jīng)確定平均分?jǐn)?shù)之間存在差異,因此我們現(xiàn)在確定這兩種方法之間差異的置信區(qū)間。我們已經(jīng)有了我們需要的大部分。差異的置信區(qū)間需要同時具有估計值和誤差范圍。
兩種方法的差異的估計很容易計算。我們只是找到d樣本均值的差異。樣本均值的這種差異估計了總體均值的差異。
對于我們的數(shù)據(jù),樣本均值的差異為84–75=9。
誤差幅度稍難計算。為此,我們需要將適當(dāng)?shù)慕y(tǒng)計量乘以標(biāo)準(zhǔn)誤差。我們需要的統(tǒng)計數(shù)據(jù)是通過查閱表格或統(tǒng)計軟件找到的。
再次使用保守近似,我們有19個自由度。對于95%的置信區(qū)間,我們看到t*=2.09。我們可以使用Excel中的T.INV函數(shù)來計算這個值。
我們現(xiàn)在把所有事情放在一起,看看我們的誤差幅度是2.09 x 1.2583,大約是2.63。置信區(qū)間為9±2.63。在五年級和三年級學(xué)生選擇的測試中,間隔為6.37至11.63分。