Sannsynlighetsfordelingsfunksjon vs sannsynlighetsdensitetsfunksjon
Sannsynlighet er sannsynligheten for at en hendelse skal skje. Denne ideen er veldig vanlig, og brukes ofte i det daglige når vi vurderer våre muligheter, transaksjoner og mange andre ting. Å utvide dette enkle konseptet til et større sett med arrangementer er litt mer utfordrende. For eksempel kan vi ikke enkelt finne ut sjansene for å vinne et lotteri, men det er praktisk, ganske intuitivt å si at det er sannsynligheten for at en av seks at vi skal få nummer seks i terningkast.
Når antall hendelser som kan finne sted blir større, eller antall individuelle muligheter er stort, mislykkes denne ganske enkle ideen om sannsynlighet. Derfor må den gis en solid matematisk definisjon før man nærmer seg problemer med høyere kompleksitet.
Når antall hendelser som kan finne sted i en enkelt situasjon er stort, er det umulig å betrakte hver hendelse individuelt som i eksemplet med terningkast. Derfor blir hele settet av hendelser oppsummert ved å introdusere begrepet den tilfeldige variabelen. Det er en variabel som kan anta verdiene til forskjellige hendelser i den aktuelle situasjonen (eller prøveområdet). Det gir matematisk sans for enkle hendelser i situasjonen, og matematisk måte å adressere hendelsen på. Mer presist er en tilfeldig variabel en reell verdifunksjon over elementene i prøveområdet. De tilfeldige variablene kan enten være diskrete eller kontinuerlige. De er vanligvis betegnet med store bokstaver i det engelske alfabetet.
Sannsynlighetsfordelingsfunksjon (eller ganske enkelt, sannsynlighetsfordelingen) er en funksjon som tildeler sannsynlighetsverdiene for hver hendelse; dvs. det gir en relasjon til sannsynlighetene for verdiene som den tilfeldige variabelen kan ta. Sannsynlighetsfordelingsfunksjonen er definert for diskrete tilfeldige variabler.
Sannsynlighetsdensitetsfunksjon er ekvivalent med sannsynlighetsfordelingsfunksjonen for kontinuerlige tilfeldige variabler, gir sannsynligheten for at en bestemt tilfeldig variabel antar en bestemt verdi.
Hvis X er en diskret tilfeldig variabel, kalles funksjonen gitt som f (x) = P (X = x) for hver x innen X området sannsynlighetsfordelingsfunksjonen. En funksjon kan fungere som sannsynlighetsfordelingsfunksjon hvis og bare hvis funksjonen oppfyller følgende betingelser.
1. f (x) ≥ 0
2. ∑ f (x) = 1
En funksjon f (x) som er definert over settet med reelle tall kalles sannsynlighetstetthetsfunksjonen til den kontinuerlige tilfeldige variabelen X, hvis og bare hvis,
P (a ≤ x ≤ b) = a ∫ b f (x) dx for alle reelle konstanter a og b.
Sannsynlighetstetthetsfunksjonen skal også tilfredsstille følgende betingelser.
1. f (x) ≥ 0 for alle x: -∞ <x <+ ∞
2. -∞ ∫ + ∞ f (x) dx = 1
Både sannsynlighetsfordelingsfunksjonen og sannsynlighetstetthetsfunksjonen brukes til å representere fordelingen av sannsynligheter over prøveområdet. Vanligvis kalles disse sannsynlighetsfordelinger.
For statistisk modellering utledes standard sannsynlighetsdensitetsfunksjoner og sannsynlighetsfordelingsfunksjoner. Normalfordelingen og standardnormalfordelingen er eksempler på kontinuerlige sannsynlighetsfordelinger. Binomialfordeling og Poisson-distribusjon er eksempler på diskrete sannsynlighetsfordelinger.
Hva er forskjellen mellom sannsynlighetsfordeling og sannsynlighetsdensitetsfunksjon?
• Sannsynlighetsfordelingsfunksjon og sannsynlighetsdensitetsfunksjon er funksjoner definert over prøveområdet, for å tildele den aktuelle sannsynlighetsverdien til hvert element.
• Sannsynlighetsfordelingsfunksjoner er definert for de diskrete tilfeldige variablene mens sannsynlighetsdensitetsfunksjoner er definert for de kontinuerlige tilfeldige variablene.
• Fordeling av sannsynlighetsverdier (dvs. sannsynlighetsfordelinger) blir best portrettert av sannsynlighetsdensitetsfunksjonen og sannsynlighetsfordelingsfunksjonen.
• Sannsynlighetsfordelingsfunksjonen kan vises som verdier i en tabell, men det er ikke mulig for sannsynlighetstetthetsfunksjonen fordi variabelen er kontinuerlig.
• Når det er tegnet, gir sannsynlighetsfordelingsfunksjonen en søylediagram, mens sannsynlighetstetthetsfunksjonen gir en kurve.
• Høyden / lengden på stolpene til sannsynlighetsfordelingsfunksjonen må legge til 1 mens området under kurven til sannsynlighetstetthetsfunksjonen må legge til 1.
• I begge tilfeller må alle verdiene til funksjonen være ikke-negative.