Skillnad mellan population och provstandardavvikelse

Befolkning vs provstandardavvikelse

I statistik används flera index för att beskriva en datamängd som motsvarar dess centrala tendens, dispersion och skevhet. Standardavvikelse är en av de vanligaste åtgärderna för spridning av data från datasetets mittpunkt.

På grund av praktiska svårigheter är det inte möjligt att använda data från hela befolkningen när en hypotes testas. Därför använder vi data värden från prover för att ge slutsatser om befolkningen. I en sådan situation kallas dessa estimatorer eftersom de uppskattar populationparametervärdena.

Det är oerhört viktigt att använda objektiva estimatorer i inferens. En uppskattare sägs vara opartisk om det förväntade värdet av denna estimator är lika med befolkningsparametern. Till exempel använder vi provmedlet som en obestämd bedömare för populationens medelvärde. (Matematiskt kan det visas att det förväntade värdet av provvärdet är lika med populationens medelvärde). Vid bedömning av befolkningsstandardavvikelsen är provstandardavvikelsen också en opartisk estimator.

Vad är populationens standardavvikelse?

När data från hela befolkningen kan tas i beaktande (till exempel vid en folkräkning) är det möjligt att beräkna befolkningsstandardavvikelsen. För att beräkna standardavvikelsen för befolkningen beräknas först avvikelserna av datavärdena från populationens medelvärde. Roten medelkvadrat (kvadratisk medelvärde) avvikelser kallas populationsstandardavvikelsen.

I en klass på 10 studenter kan uppgifter om eleverna enkelt samlas in. Om en hypotes är testad på denna population av studenter är det inte nödvändigt att använda provvärden. Vikten av de 10 eleverna (i kg) mäts till exempel 70, 62, 65, 72, 80, 70, 63, 72, 77 och 79. Då är de tio människornas vikt (i kilogram) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, vilket är 71 (i kilogram). Detta är populationens medelvärde.

För att beräkna befolkningsstandardavvikelsen beräknar vi avvikelser från medelvärdet. De respektive avvikelserna från medelvärdet är (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 och (79-71) = 8. Summan av kvadraten för avvikelse är -1) ² + (-9) ² + (-6) ² + 1 ² + 9 ^{2 < + (-1)} 2 ^{+ (-8)} 2 ^{+ 1} 2 ^{+ 6} 2 ^{+ 8} 2 ^{= 366. Populationens standardavvikelse är √ (366/10) = 6,05 (i kg). 71 är den exakta medelvikten för eleverna i klassen och 6.05 är den exakta standardavvikelsen för vikt från 71.} Vad är provstandardavvikelsen?

När data från ett prov (av storlek n) används för att uppskatta befolkningens parametrar beräknas provstandardavvikelsen. Först beräknas avvikelserna av datavärdena från provmedelvärdet. Eftersom provmedlet används i stället för populationsmedelvärdet (vilket är okänt) är det inte lämpligt att ta det kvadratiska medelvärdet. För att kompensera för användningen av provmedlet divideras summan av kvadrater av avvikelser med (n-1) i stället för n. Provstandardavvikelsen är kvadratroten av detta. I matematiska symboler, S = √ (Σ (x

i _-ẍ) 2 ^{/ (n-1)}, där S är provstandardavvikelsen, är ẍ provvärdet och x} i _{s är datapunkterna.} Anta nu att befolkningen i det föregående exemplet är eleverna i hela skolan. Då är klassen bara ett prov. Om detta prov används i uppskattningen kommer provstandardavvikelsen att vara √ (366/9) = 6 38 (i kg) eftersom 366 delades med 9 istället för 10 (provstorleken). Faktum att observera är att detta inte garanteras vara det exakta befolkningsstandardvärdesavvikelsen. Det är bara en uppskattning för det.

Vad är skillnaden mellan populationsstandardavvikelse och provstandardavvikelse?

• Befolkningsstandardavvikelsen är det exakta parametervärdet som används för att mäta dispersionen från mitten, medan provstandardavvikelsen är en obestämd estimator för den.

• Befolkningsstandardavvikelsen beräknas när alla uppgifter om varje individs befolkning är kända. Annars beräknas provstandardavvikelsen.

• Befolkningsstandardavvikelsen ges av σ = √ {Σ (xi-μ)

2 ^{/ n} där μ är populationens medelvärde och n är befolkningsstorleken men provstandardavvikelsen ges av S = √ {Σ (xi-ẍ)} 2 ^{/ (n-1)} där ẍ är provvärdet och n är provstorleken.}

Skillnad mellan population och provstandardavvikelse

Rekommenderad