Gjennomsnittlig vs Median vs Mode
Gjennomsnitt, median og modus er de viktigste målene for sentral tendens brukt i beskrivende statistikk. De er helt forskjellige fra hverandre, og tilfeller der de brukes til å oppsummere dataene er også forskjellige.
Mener
Det aritmetiske gjennomsnittet er summen av dataverdiene delt på antall dataverdier, dvs.
Hvis dataene kommer fra et prøveområde, kalles det et eksempel middel (
), som er en beskrivende statistikk for prøven. Selv om det er det mest brukte beskrivende tiltaket for et utvalg, er det ikke en solid statistikk. Det er veldig følsomt for outliers og svingninger.
Tenk for eksempel på gjennomsnittsinntekten til innbyggerne i en bestemt by. Siden alle dataverdiene summeres og deretter deles, påvirker inntekten til en ekstremt velstående person gjennomsnittet betydelig. Derfor er middelverdiene ikke alltid en god representasjon av dataene.
I tilfelle av et vekslende signal varierer også strømmen som passerer gjennom et element periodisk fra positiv retning til negativ retning og omvendt. Hvis vi tar gjennomsnittsstrømmen som går gjennom elementet i en enkelt periode, vil det gi en 0, noe som betyr at ingen strøm har gått gjennom elementet, noe som åpenbart ikke er sant. Derfor, i dette tilfellet, er ikke aritmetisk middel et godt mål.
Det aritmetiske gjennomsnittet er en god indikator når dataene fordeles jevnt. For en normalfordeling er gjennomsnittet lik modus og median. Den har også de laveste restene når man vurderer rotens gjennomsnittlige kvadratfeil; derfor det beste beskrivende tiltaket når det kreves å representere et datasett med et enkelt tall.
Median
Verdiene til det midterste datapunktet etter å ha ordnet alle dataverdiene i stigende rekkefølge er definert som medianen til datasettet. Median er 2. kvartil, 5. desil og 50. persentil.
• Hvis antall observasjoner (datapunkter) er merkelig, så er medianen observasjonen nøyaktig midt på den bestilte listen.
• Hvis antallet observasjoner (datapunkter) er jevnt, er medianen gjennomsnittet av de to midtobservasjonene i den ordnede listen.
Median deler observasjonen i to grupper; dvs. en gruppe (50%) av verdier høyere og en gruppe (50%) av verdier lavere enn medianen. Medianer brukes spesielt i skjev fordeling og representerer data ganske bedre enn det aritmetiske gjennomsnittet.
Modus
Mode er det mest forekommende tallet i et sett med observasjoner. Modusen til et datasett beregnes ved å finne frekvensen til hvert element i settet.
• Hvis ingen verdi forekommer mer enn en gang, har datasettet ingen modus.
• Ellers er enhver verdi som oppstår med størst frekvens en modus for datasettet.
Mer enn 1 modus kan eksistere i et sett; derfor er modus ikke en unik statistikk for et datasett. I en jevn fordeling er det en modus. Modusen for en diskret sannsynlighetsfordeling er det punktet hvor sannsynlighetsmassefunksjonen når sitt høyeste punkt. Gjengivelse fra ovenstående tolkninger, kan vi si at globale maksimum er moduser.
Vurder anvendelsen av alle tre tiltakene i følgende datasett.
DATA: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Gjennomsnitt = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25 = 8.12
Median = 9 (13. element)
Mode = 9 (frekvens 9 = 5)
Hva er forskjellen mellom gjennomsnitt, median og modus?
• Aritmetisk gjennomsnitt er summen av verdiene (observasjoner) delt på antall observasjoner. Det er ikke en solid statistikk, og er sterkt avhengig av normalfordelingsnaturen innenfor den aktuelle fordelingen. En enkelt outlier kan føre til en betydelig endring i gjennomsnittet som gir relativt misvisende verdier. Konseptet kan utvides til geometrisk gjennomsnitt, harmonisk gjennomsnitt, vektet gjennomsnitt og så videre.
• Median er midtverdiene i settet med observasjoner, og det påvirkes relativt mindre av outliers. Det kan gi et godt estimat som oppsummeringsstatistikken i svært skjevte tilfeller.
• Mode er de vanligste observasjonsverdiene i datasettet. Hvis fordelingen er positiv skjev, ligger modusen igjen til medianen, og hvis negativt skjev, ligger modusen rett til medianen.
• Hvis positivt skjevt, er gjennomsnittet riktig til medianen; hvis negativt skjevt gjennomsnitt er til venstre for medianen.
• I normalfordelingen er alle tre, gjennomsnitt, modus og median like.