幼兒健康知識(shí)大全_什么是內(nèi)圍欄和外圍欄?

數(shù)據(jù)集的一個(gè)重要特征是確定它是否包含任何異常值。幼兒健康知識(shí)大全在我們的數(shù)據(jù)集中,異常值直觀地被認(rèn)為是與大多數(shù)其他數(shù)據(jù)有很大不同的值。當(dāng)然,這種對(duì)異常值的理解是模棱兩可的。要被視為異常值,該值應(yīng)該偏離其余數(shù)據(jù)多少?一個(gè)研究人員稱之為異常值會(huì)與另一個(gè)匹配嗎?為了提供一些一致性和定量測(cè)量異常值的確定,我們使用內(nèi)外圍欄。

為了找到一組數(shù)據(jù)的內(nèi)部和外部圍欄,我們首先需要一些其他描述性統(tǒng)計(jì)數(shù)據(jù)。我們將首先計(jì)算四分位數(shù)。這將導(dǎo)致四分位間距。**,通過我們的這些計(jì)算,我們將能夠確定內(nèi)部和外部的圍欄。

Quartiles

第一和第三四分位數(shù)幼兒健康知識(shí)大全是任何一組定量數(shù)據(jù)的五個(gè)數(shù)字摘要的一部分。我們首先在所有值按升序列出后找到數(shù)據(jù)的中位數(shù)或中點(diǎn)。小于中值的值對(duì)應(yīng)于大約一半的數(shù)據(jù)。我們找到這一半數(shù)據(jù)集的中位數(shù),這是第一個(gè)四分位數(shù)。

以類似的方式,我們現(xiàn)在考慮數(shù)據(jù)集的上半部分。如果我們找到這一半數(shù)據(jù)的中位數(shù),那么我們有第三四分位數(shù)。這些四分位數(shù)的名字來源于他們將數(shù)據(jù)集分成四個(gè)相等大小的部分或四分之一。換句話說,大約25%的數(shù)據(jù)值小于第一個(gè)四分位數(shù)。以類似的方式,大約75%的數(shù)據(jù)值小于第三四分位數(shù)。

Interquartile Range

我們接下來需要找到四分位間距(IQR)。這比第一個(gè)四分位數(shù)q和第三個(gè)四分位數(shù)q更容易計(jì)算。我們需要做的就是采取行動(dòng)e這兩個(gè)四分位數(shù)的差異。這給了我們公式:

教育_1

IQR=Q-Q

IQR告訴我們數(shù)據(jù)集的中間部分是如何分布的。

找到內(nèi)部圍欄

我們現(xiàn)在可以找到內(nèi)部的圍欄。我們從IQR開始,將這個(gè)數(shù)字乘以1.5。然后,我們從第一個(gè)四分位數(shù)中減去這個(gè)數(shù)字。我們還將此數(shù)字添加到第三個(gè)四分位數(shù)。這兩個(gè)數(shù)字構(gòu)成了我們的內(nèi)圍欄。

找到外圍欄55 56

對(duì)于外部圍欄,我們從IQR開始,將這個(gè)數(shù)字乘以3。然后,我們從第一個(gè)四分位數(shù)中減去這個(gè)數(shù)字,并將其加到第三個(gè)四分位數(shù)。這兩個(gè)數(shù)字是我們的外部圍欄。

檢測(cè)異常值

現(xiàn)在,異常值的檢測(cè)變得與確定數(shù)據(jù)值參考我們的內(nèi)部和外部圍欄的位置一樣容易。如果單個(gè)數(shù)據(jù)值比我們的任何一個(gè)外部圍欄都更極端,那么這是一個(gè)異常值,有時(shí)被稱為強(qiáng)異常值。如果我們的數(shù)據(jù)值位于相應(yīng)的內(nèi)部和外部圍欄之間,則該值為可疑異常值或輕度異常值。我們將通過下面的示例看到它是如何工作的。

示例

假設(shè)我們已經(jīng)計(jì)算了數(shù)據(jù)的第一和第三四分位數(shù),并分別找到了50和60的這些值。四分位間距IQR=60–50=10。接下來,我們看到1.5 x IQR=15。這意味著內(nèi)部圍欄分別為50-15=35和60+15=75。這比第一個(gè)四分位數(shù)少1.5倍IQR,比第三個(gè)四分位數(shù)多。

我們現(xiàn)在計(jì)算3 x IQR,看到這是3 x 10=30。外圍欄比第一和第三四分位數(shù)更極端3倍IQR。這意味著外圍欄是50-30=20和60+30=90。

任何小于20或大于90的數(shù)據(jù)值都被考慮在內(nèi)列斯。任何29到35或75到90之間的數(shù)據(jù)值都被懷疑是異常值。