Lineær kontra logistisk regresjon
I statistisk analyse er det viktig å identifisere sammenhengen mellom aktuelle variabler til studien. Noen ganger kan det være det eneste formålet med selve analysen. Et sterkt verktøy som brukes til å etablere et forhold og identifisere forholdet er regresjonsanalyse.
Den enkleste formen for regresjonsanalyse er den lineære regresjonen, hvor forholdet mellom variablene er et lineært forhold. I statistiske termer får den frem forholdet mellom den forklarende variabelen og responsvariabelen. Ved å bruke regresjon kan vi for eksempel etablere sammenhengen mellom råvareprisen og forbruket basert på data samlet fra et tilfeldig utvalg. Regresjonsanalyse vil produsere en regresjonsfunksjon av datasettet, som er en matematisk modell som passer best til tilgjengelige data. Dette kan lett representeres av et spredningsdiagram. Grafisk regresjon tilsvarer å finne den beste tilpasningskurven for det gitte datasettet. Funksjonen til kurven er regresjonsfunksjonen. Ved hjelp av den matematiske modellen kan bruken av en vare forutsies for en gitt pris.
Derfor blir regresjonsanalysen mye brukt i å forutsi og forutsi. Det brukes også til å etablere relasjonene i eksperimentelle data, innen feltene fysikk, kjemi, og i mange naturvitenskapelige og tekniske fagdisipliner. Hvis forholdet eller regresjonsfunksjonen er en lineær funksjon, er prosessen kjent som en lineær regresjon. I spredningsdiagrammet kan det vises som en rett linje. Hvis funksjonen ikke er en lineær kombinasjon av parametrene, er regresjonen ikke-lineær.
Logistisk regresjon er sammenlignbar med multivariat regresjon, og den skaper en modell for å forklare effekten av flere prediktorer på en responsvariabel. Imidlertid, i logistisk regresjon, bør sluttresultatvariabelen være kategorisk (vanligvis delt, dvs. et par oppnåelige resultater, som død eller overlevelse, selv om spesielle teknikker gjør det mulig å modellere mer kategorisert informasjon). En kontinuerlig resultatvariabel kan transformeres til en kategorisk variabel som skal brukes til logistisk regresjon; kollapsing av kontinuerlige variabler på denne måten frarådes imidlertid for det meste fordi det reduserer nøyaktigheten.
I motsetning til i lineær regresjon, mot gjennomsnittet, trenger ikke prediktorvariablene i logistisk regresjon å bli tvunget til å være lineært forbundet, ofte distribuert, eller å ha like varians i hver klynge. Som et resultat er forholdet mellom prediktor og utfallsvariabler sannsynligvis ikke en lineær funksjon.
Hva er forskjellen mellom logistisk og lineær regresjon?
• Ved lineær regresjon antas en lineær sammenheng mellom den forklarende variabelen og responsvariabelen, og parametere som tilfredsstiller modellen, blir funnet ved analyse for å gi det eksakte forholdet.
• Lineær regresjon utføres for kvantitative variabler, og den resulterende funksjonen er kvantitativ.
• I den logistiske regresjonen kan data som brukes enten være kategoriske eller kvantitative, men resultatet er alltid kategorisk.