Spredning vs skjevhet
I statistikk og sannsynlighetsteori må variasjonen i distribusjonene ofte uttrykkes kvantitativt for sammenligningsformål. Dispersion and Skewness er to statistiske begreper hvor formen på fordelingen presenteres i en kvantitativ skala.
Mer om spredning
I statistikk er spredningen variasjonen til en tilfeldig variabel eller dens sannsynlighetsfordeling. Det er et mål på hvor langt datapunktene ligger fra den sentrale verdien. For å uttrykke dette kvantitativt brukes dispersjonsmål i beskrivende statistikk.
Variasjon, standardavvik og intervall mellom kvartiler er de vanligste målingene for spredning.
Hvis dataverdiene har en bestemt enhet, på grunn av skalaen, kan målingene av spredning også ha de samme enhetene. Interdecile rekkevidde, rekkevidde, gjennomsnittsforskjell, median absolutt avvik, gjennomsnittlig absolutt avvik og avstand standardavvik er mål for spredning med enheter.
Derimot er det målinger av spredning som ikke har noen enheter, dvs. dimensjonsløse. Variasjon, variasjonskoeffisient, kvartil dispersjonskoeffisient og relativ gjennomsnittsforskjell er mål for dispersjon uten enheter.
Spredning i et system kan stamme fra feil, for eksempel instrumentelle og observasjonsfeil. Også tilfeldige variasjoner i selve prøven kan forårsake variasjoner. Det er viktig å ha en kvantitativ ide om variasjonen i data før du trekker andre konklusjoner fra datasettet.
Mer om skjevhet
I statistikk er skjevhet et mål på asymmetri av sannsynlighetsfordelingene. Skjevhet kan være positiv eller negativ, eller i noen tilfeller ikke-eksisterende. Det kan også betraktes som et mål for kompensasjon fra normalfordelingen.
Hvis skjevheten er positiv, er hovedparten av datapunktene sentrert til venstre for kurven, og høyre hale er lengre. Hvis skjevheten er negativ, er hoveddelen av datapunktene sentrert mot høyre for kurven, og venstre hale er ganske lang. Hvis skjevheten er null, er populasjonen normalt fordelt.
I en normalfordeling, det vil si når kurven er symmetrisk, har gjennomsnittet, medianen og modusen den samme verdien. Hvis skjevheten ikke er null, holder ikke denne egenskapen, og gjennomsnittet, modusen og medianen kan ha forskjellige verdier.
Pearsons første og andre koeffisienter for skjevhet brukes ofte til å bestemme skjevheten til fordelingen.
Pearsons første skjevhet kaffesent = (middel - modus) / (standardavvik)
Pearsons andre skjevhet kaffesent = 3 (middel - modus) / (satndard avvik)
I mer sensitive tilfeller brukes justert Fisher-Pearson standardisert momentkoeffisient.
G = {n / (n-1) (n-2)} ∑ n i = 1 ((y-ӯ) / s) 3
Hva er forskjellen mellom spredning og skjevhet?
Dispersjons bekymringer om rekkevidden datapunktene er fordelt over, og skjevheten gjelder symmetrien til fordelingen.
Begge målingene av spredning og skjevhet er beskrivende mål, og skjevhetskoeffisienten gir en indikasjon på fordelingen.
Målinger av spredning brukes til å forstå rekkevidden til datapunktene og forskyves fra gjennomsnittet mens skjevhet brukes til å forstå tendensen til variasjonen av datapunkter i en bestemt retning.