標(biāo)準(zhǔn)差的范圍規(guī)則
標(biāo)準(zhǔn)偏差和范圍都是數(shù)據(jù)集擴(kuò)展的度量。每個(gè)數(shù)字都以自己的方式告訴我們數(shù)據(jù)的間隔方式,因?yàn)樗鼈兌际亲兓亩攘?。雖然范圍和標(biāo)準(zhǔn)偏差之間沒(méi)有明確的關(guān)系,有一個(gè)經(jīng)驗(yàn)法則可以將這兩個(gè)統(tǒng)計(jì)量聯(lián)系起來(lái)。這種關(guān)系有時(shí)被稱為標(biāo)準(zhǔn)差的范圍規(guī)則。
范圍規(guī)則告訴我們,樣本的標(biāo)準(zhǔn)偏差大約等于數(shù)據(jù)范圍的四分之一。換句話說(shuō),s=(**-最?。?4。這是一個(gè)非常直接的使用公式,只能用作標(biāo)準(zhǔn)偏差的非常粗略的估計(jì)。
一個(gè)例子
要查看范圍規(guī)則如何工作的示例,我們將查看以下示例。假設(shè)我們從12,12,14,15,16,18,18,20,20,25的數(shù)據(jù)值開(kāi)始。這些值的平均值為17,標(biāo)準(zhǔn)偏差約為4.1。相反,如果我們首先將數(shù)據(jù)范圍計(jì)算為25–12=13,然后將該數(shù)字除以四,則我們對(duì)標(biāo)準(zhǔn)偏差的估計(jì)為13/4=3.25。這個(gè)數(shù)字相對(duì)接近真實(shí)的標(biāo)準(zhǔn)偏差,對(duì)粗略估計(jì)很好。
為什么有效?
似乎范圍規(guī)則有點(diǎn)奇怪。為什么它有效?將范圍劃分為四個(gè)似乎并不完全隨意?為什么我們不除以不同的數(shù)字?實(shí)際上在事后有一些數(shù)學(xué)理由。
回想一下鐘形曲線的屬性和標(biāo)準(zhǔn)正態(tài)分布的概率。一個(gè)特征與落在一定標(biāo)準(zhǔn)偏差范圍內(nèi)的數(shù)據(jù)量有關(guān):
- 大約68%的數(shù)據(jù)與平均值相差一個(gè)標(biāo)準(zhǔn)偏差(更高或更低)。
- 大約95%of數(shù)據(jù)與平均值相差兩個(gè)標(biāo)準(zhǔn)差(較高或較低)。
- 大約99%與平均值相差三個(gè)標(biāo)準(zhǔn)差(較高或較低)。
我們將使用的數(shù)字與95%有關(guān)。我們可以說(shuō)95%從低于平均值的兩個(gè)標(biāo)準(zhǔn)偏差到高于平均值的兩個(gè)標(biāo)準(zhǔn)偏差,我們有95%的數(shù)據(jù)。因此,我們幾乎所有的正態(tài)分布都會(huì)延伸到總共四個(gè)標(biāo)準(zhǔn)偏差的線段上。
糖健康知識(shí)
并非所有數(shù)據(jù)都是正態(tài)分布且呈鐘形曲線。但是大多數(shù)數(shù)據(jù)的行為都足夠好,以至于偏離平均值兩個(gè)標(biāo)準(zhǔn)差幾乎可以捕獲所有數(shù)據(jù)。我們估計(jì)并說(shuō)四個(gè)標(biāo)準(zhǔn)偏差大約是范圍的大小,因此范圍除以四是標(biāo)準(zhǔn)偏差的粗略近似值。
用于范圍規(guī)則
范圍規(guī)則在許多設(shè)置中都很有用。首先,它是對(duì)標(biāo)準(zhǔn)偏差的非常快速的估計(jì)。標(biāo)準(zhǔn)差要求我們首先找到平均值,然后從每個(gè)數(shù)據(jù)點(diǎn)中減去該平均值,將差異平方,加上這些,除以小于數(shù)據(jù)點(diǎn)數(shù)量的一個(gè),然后(**)取平方根。另一方面,范圍規(guī)則只需要一次減法和一次除法。
范圍規(guī)則有幫助的其他地方是我們信息不完整的地方。確定樣本量的公式需要三條信息:所需的誤差范圍,置信水平和我們正在調(diào)查的人口的標(biāo)準(zhǔn)差。很多時(shí)候不可能知道人口標(biāo)準(zhǔn)差是什么。使用范圍規(guī)則,我們可以估計(jì)這個(gè)統(tǒng)計(jì)量,然后知道我們應(yīng)該做多少樣本。