Nøkkelforskjell - Overvåket vs Uovervåket maskinlæring
Overvåket læring og uten tilsyn læring er to kjernebegrep for maskinlæring. Supervised Learning er en maskinlæringsoppgave med å lære en funksjon som tilordner en inngang til en utgang basert på eksemplene på inngangs- og utgangspar. Uovervåket læring er maskinlæringsoppgaven med å utlede en funksjon for å beskrive skjult struktur fra umerkede data. Hovedforskjellen mellom maskinlæring under tilsyn og uten tilsyn er at overvåket læring bruker merkede data, mens ikke-tilsatt læring bruker umerkede data.
Machine Learning er et felt innen informatikk som gir muligheten for et datasystem til å lære av data uten å være eksplisitt programmert. Den lar deg analysere dataene og forutsi mønstre i den. Det er mange anvendelser av maskinlæring. Noen av dem er ansiktsgjenkjenning, gestgjenkjenning og talegjenkjenning. Det er forskjellige algoritmer knyttet til maskinlæring. Noen av dem er regresjon, klassifisering og gruppering. De vanligste programmeringsspråkene for utvikling av maskinlæringsbaserte applikasjoner er R og Python. Andre språk som Java, C ++ og Matlab kan også brukes.
INNHOLD
1. Oversikt og nøkkelforskjell
2. Hva er veiledet læring
3. Hva er ikke-overvåket læring
4. Likheter mellom overvåket og ikke-overvåket maskinlæring
5. Sammenligning ved siden av hverandre - Overvåket vs Uovervåket maskinlæring i tabellform
6. Oppsummering
Hva er veiledet læring?
I maskinlæringsbaserte systemer fungerer modellen i henhold til en algoritme. I veiledet læring overvåkes modellen. Først er det nødvendig å trene modellen. Med den oppnådde kunnskapen kan den forutsi svar for fremtidige forekomster. Modellen er trent ved hjelp av et merket datasett. Når en ut av eksempeldata blir gitt til systemet, kan den forutsi resultatet. Følgende er et lite utdrag fra det populære IRIS-datasettet.
I henhold til tabellen ovenfor kalles kelbenslengde, kelkbåndsbredde, patellengde, patelbredde og art attributtene. Kolonnene er kjent som funksjoner. En rad har data for alle attributter. Derfor kalles en rad en observasjon. Dataene kan enten være numeriske eller kategoriske. Modellen får observasjonene med tilsvarende artsnavn som innspill. Når en ny observasjon er gitt, skal modellen forutsi hvilken type art den tilhører.
I veiledet læring er det algoritmer for klassifisering og regresjon. Klassifisering er prosessen med å klassifisere merkede data. Modellen skapte grenser som skilte datakategoriene. Når nye data blir gitt til modellen, kan den kategorisere ut fra hvor poenget eksisterer. De K-nærmeste naboene (KNN) er en klassifiseringsmodell. Avhengig av k-verdien avgjøres kategorien. For eksempel, når k er 5, hvis et bestemt datapunkt er nær åtte datapunkter i kategori A og seks datapunkter i kategori B, vil datapunktet bli klassifisert som A.
Regresjonen er prosessen med å forutsi trenden med tidligere data for å forutsi utfallet av de nye dataene. I regresjon kan utgangen bestå av en eller flere kontinuerlige variabler. Forutsigelse gjøres ved hjelp av en linje som dekker de fleste datapunkter. Den enkleste regresjonsmodellen er en lineær regresjon. Det er raskt og krever ikke innstillingsparametere som i KNN. Hvis dataene viser en parabolisk trend, er ikke den lineære regresjonsmodellen egnet.
Dette er noen eksempler på veiledede læringsalgoritmer. Generelt er resultatene generert fra veiledede læringsmetoder mer nøyaktige og pålitelige fordi inndataene er velkjente og merkede. Derfor må maskinen bare analysere de skjulte mønstrene.
Hva er læring uten tilsyn?
I uten tilsyn læring blir ikke modellen overvåket. Modellen fungerer alene, for å forutsi resultatene. Den bruker maskinlæringsalgoritmer for å komme til konklusjoner om umerkede data. Generelt er de ikke-tilsynte læringsalgoritmene vanskeligere enn overvåket læringsalgoritmer fordi det er lite informasjon. Klynging er en type uten tilsyn læring. Den kan brukes til å gruppere ukjente data ved hjelp av algoritmer. K-middel og tetthetsbasert klynging er to klyngealgoritmer.
k-betyr algoritme, plasserer k centroid tilfeldig for hver klynge. Deretter tildeles hvert datapunkt til nærmeste sentroid. Euklidisk avstand brukes til å beregne avstanden fra datapunktet til sentroid. Datapunktene er klassifisert i grupper. Posisjonene for k sentroider blir beregnet på nytt. Den nye sentroidposisjonen bestemmes av gjennomsnittet av alle poeng i gruppen. Igjen tildeles hvert datapunkt til nærmeste sentroid. Denne prosessen gjentas til sentroidene ikke lenger endres. k-middel er en rask klyngealgoritme, men det er ingen spesifisert initialisering av klyngepunkter. Det er også en høy variasjon av klyngemodeller basert på initialisering av klyngepunkter.
En annen klyngealgoritme er tetthetsbasert klynging. Det er også kjent som tetthetsbaserte romlige klyngeapplikasjoner med støy. Det fungerer ved å definere en klynge som det maksimale settet med tetthetstilknyttede punkter. De er to parametere som brukes for tetthetsbasert klynging. De er Ɛ (epsilon) og minimumspoeng. Ɛ er den maksimale radiusen i nabolaget. Minimumspoengene er minimumspoengene i nabolaget to for å definere en klynge. Dette er noen eksempler på klynger som faller inn under læring uten tilsyn.
Generelt er resultatene generert fra ikke-overvåket læringsalgoritmer ikke mye nøyaktige og pålitelige fordi maskinen må definere og merke inngangsdata før de bestemmer de skjulte mønstrene og funksjonene.
Hva er likheten mellom maskinlæring under tilsyn og uten tilsyn?
Både Overvåket og Uovervåket læring er typer maskinlæring
Hva er forskjellen mellom tilsyn og ikke-tilsyn med maskinlæring?
Diff Article Midt før tabell
Overvåket vs Uovervåket maskinlæring |
|
Overvåket læring er maskinlæringsoppgaven med å lære en funksjon som tilordner en inngang til en utgang basert på eksempler på inngangs- og utgangspar. | Uovervåket læring er maskinlæringsoppgaven med å utlede en funksjon for å beskrive skjult struktur fra umerkede data. |
Hovedfunksjonalitet | |
I veiledet læring forutsier modellen utfallet basert på merkede inngangsdata. | I uten tilsyn læring forutsier modellen utfallet uten merkede data ved å identifisere mønstrene alene. |
Nøyaktighet av resultatene | |
Resultatene generert fra veiledede læringsmetoder er mer nøyaktige og pålitelige. | Resultatene generert fra ikke-overvåket læringsmetode er ikke mye nøyaktige og pålitelige. |
Hovedalgoritmer | |
Det er algoritmer for regresjon og klassifisering i veiledet læring. | Det er algoritmer for klynging i læring uten tilsyn. |
Sammendrag - Overvåket vs Uovervåket maskinlæring
Overvåket læring og Uovervåket læring er to typer maskinlæring. Overvåket læring er maskinlæringsoppgaven med å lære en funksjon som tilordner en inngang til en utgang basert på eksempler på inngangs- og utgangspar. Uovervåket læring er maskinlæringsoppgaven med å utlede en funksjon for å beskrive skjult struktur fra umerkede data. Forskjellen mellom overvåket og ikke-overvåket maskinlæring er at overvåket læring bruker merkede data mens ikke-overvåket skjevhet bruker umerkede data.