Avvik vs standardavvik
Avvik vs standardavvik
I beskrivende og inferensiell statistikk brukes flere indekser for å beskrive et datasett som tilsvarer dets sentrale tendens, spredning og skjevhet. I statistisk slutning er disse ofte kjent som estimatorer, siden de estimerer verdiene for populasjonsparameteren.
Dispersjon er målet for spredningen av data rundt sentrum av datasettet. Standardavvik er et av de mest brukte dispersjonsmålene. Avvikene til hvert datapunkt fra gjennomsnittet tas i betraktning når man beregner standardavviket. Derfor kan man argumentere for at standardavviket sammen med gjennomsnittet vil gi et nesten tilstrekkelig bilde av et datasett.
Vurder følgende datasett. Vekten til 10 personer (i kilo) måles til å være 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Da er gjennomsnittsvekten til de ti personene (i kilo) 71 (i kilogram)).
Hva er avvik?
I statistikk betyr avvik mengden som et enkelt datapunkt skiller seg fra en fast verdi som gjennomsnittet. Generelt, la k være en fast verdi og x 1, x 2,…, x n betegner et datasett. Deretter er avviket til x j fra k definert til å være (x j - k).
For eksempel, i datasettet ovenfor er de respektive avvikene fra gjennomsnittet (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 og (79 - 71) = 8.
Hva er standardavvik?
Når data fra hele befolkningen kan tas i betraktning (for eksempel ved folketelling), er det mulig å beregne populasjonsstandardavviket. For å beregne standardavviket til populasjonen, beregnes først avvikene fra dataverdier fra populasjonsgjennomsnittet. Rots middelkvadrat (kvadratisk gjennomsnitt) av avvik kalles populasjonsstandardavvik. I symboler er σ = √ {∑ (x i -µ) 2 / n} hvor µ er populasjonsgjennomsnittet og n er populasjonsstørrelsen.
Når data fra et utvalg (av størrelse n) brukes til å estimere parametere for populasjonen, beregnes prøvenes standardavvik. Først beregnes avvikene fra dataverdiene fra gjennomsnittet av prøven. Siden gjennomsnittet av prøven brukes i stedet for gjennomsnittet av populasjonen (som er ukjent), er det ikke hensiktsmessig å ta det kvadratiske gjennomsnittet. For å kompensere for bruken av prøvene er summen av kvadratene av avvik delt på (n-1) i stedet for n. Eksempelets standardavvik er kvadratroten til dette. I matematiske symboler er S = √ {∑ (x i -ẍ) 2 / (n-1)}, hvor S er standardavviket for prøven, ẍ er gjennomsnittet av prøven og xi er datapunktene.
I det forrige datasettet er summen av avviks kvadrater (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Dermed er populasjonsstandardavviket √ (366/10) = 6,05 (i kilo). (Forutsatt at befolkningen under vurdering består av de 10 personene dataene ble hentet fra).
Hva er forskjellen mellom avvik og standardavvik? • Standardavvik er en statistisk indeks og en estimator, men avvik er ikke. • Standardavvik er et mål for spredning av en klynge av data fra sentrum, mens avvik refererer til hvor mye et enkelt datapunkt skiller seg fra en fast verdi. |