Skillnad mellan avvikelse och standardavvikelse

Anonim

Avvikelse mot standardavvikelse

Avvikelse mot standardavvikelse

I beskrivande och inferentiell statistik används flera index för att beskriva en dataset som motsvarar dess centrala tendens, dispersion och skevhet. I statistisk inferens är dessa vanligen kända som bedömare eftersom de uppskattar populationparametervärdena.

Dispersion är måttet på spridningen av data runt mitten av datasatsen. Standardavvikelsen är en av de mest använda sprutåtgärderna. Avvikelserna för varje datapunkt från medelvärdet beaktas vid beräkning av standardavvikelsen. Därför kan man argumentera att standardavvikelsen tillsammans med medelvärdet ger en nästan tillräcklig bild om en dataset.

Tänk på följande dataset. Vikten av 10 personer (i kg) mäts till 70, 62, 65, 72, 80, 70, 63, 72, 77 och 79. Sedan är den genomsnittliga vikten av de tio personerna (i kilo) 71 (i kilogram).

Vad är avvikelse?

I statistik betyder avvikelse mängden med vilken en enda datapunkt skiljer sig från ett fast värde, såsom medelvärdet. I allmänhet, låt k vara ett fast värde och x 1 , x 2 , …, x n betecknar en dataset. Därefter definieras avvikelsen av x j från k att vara (x j - k).

I ovanstående dataset är respektive avvikelser från medelvärdet (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72-71) = 1, (80-71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 och (79 - 71) = 8.

Vad är standardavvikelsen?

När man kan ta hänsyn till data från hela befolkningen (till exempel när det gäller en folkräkning), är det möjligt att beräkna befolkningsstandardavvikelsen. För att beräkna standardavvikelsen för befolkningen beräknas först avvikelserna av datavärdena från populationens medelvärde. Roten medelkvadrat (kvadratisk medelvärde) avvikelser kallas populationsstandardavvikelsen. I symboler, σ = √ (Σ (x i -μ) 2 / n} där μ är populationens medelvärde och n är befolkningsstorleken.

När data från ett prov (av storlek n) används för att uppskatta befolkningens parametrar beräknas provstandardavvikelsen. Först beräknas avvikelserna av datavärdena från provmedelvärdet. Eftersom provmedlet används i stället för populationsmedelvärdet (vilket är okänt) är det inte lämpligt att ta det kvadratiska medelvärdet. För att kompensera för användningen av provmedlet divideras summan av kvadraterna av avvikelser med (n-1) i stället för n. Provstandardavvikelsen är kvadratroten av detta.I matematiska symboler, S = √ (Σ (x i -ẍ) 2 / (n-1)}, där S är provstandardavvikelsen, är ẍ provvärdet och xi är datapunkterna.

I föregående datamängd är summan av avvikelsens kvadrat (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Följaktligen är befolkningsstandardavvikelsen √ (366/10) = 6,05 (i kilogram). (Förutsatt att den aktuella befolkningen består av de 10 personer från vilka uppgifterna togs).

Vad är skillnaden mellan avvikelse och standardavvikelse?

• Standardavvikelsen är ett statistiskt index och en estimator, men avvikelsen är inte.

• Standardavvikelse är ett mått på spridning av ett grupp av data från mitten, medan avvikelse avser den mängd med vilken en enda datapunkt skiljer sig från ett fast värde.