Forskjellen Mellom Data Mining Og OLAP

Forskjellen Mellom Data Mining Og OLAP
Forskjellen Mellom Data Mining Og OLAP

Video: Forskjellen Mellom Data Mining Og OLAP

Video: Forskjellen Mellom Data Mining Og OLAP
Video: OLAP-куб. Деморолик Loginom Community Edition 2025, Januar
Anonim

Data Mining vs OLAP

Både data mining og OLAP er to av de vanlige Business Intelligence (BI) teknologiene. Forretningsintelligens refererer til databaserte metoder for å identifisere og hente ut nyttig informasjon fra forretningsdata. Data mining er feltet informatikk som arbeider med å hente ut interessante mønstre fra store datasett. Den kombinerer mange metoder fra kunstig intelligens, statistikk og databaseadministrasjon. OLAP (online analytisk behandling) som navnet antyder, er en samling av måter å spørre på flerdimensjonale databaser.

Data mining er også kjent som Knowledge Discovery in data (KDD). Som nevnt ovenfor er det et informatikkfelt som omhandler utvinning av tidligere ukjent og interessant informasjon fra rådata. På grunn av den eksponentielle veksten av data, spesielt i områder som virksomhet, har data mining blitt et veldig viktig verktøy for å konvertere denne store mengden data til business intelligence, ettersom manuell utvinning av mønstre har blitt tilsynelatende umulig de siste tiårene. For eksempel er den for tiden brukt til forskjellige applikasjoner, for eksempel analyse av sosiale nettverk, oppdagelse av svindel og markedsføring. Data mining behandler vanligvis følgende fire oppgaver: klynging, klassifisering, regresjon og tilknytning. Clustering er å identifisere lignende grupper fra ustrukturerte data. Klassifisering er læringsregler som kan brukes på nye data og inkluderer vanligvis følgende trinn: forbehandling av data, utforming av modellering, læring / funksjonsvalg og evaluering / validering. Regresjon er å finne funksjoner med minimal feil for å modellere data. Og assosiasjon er på jakt etter forhold mellom variabler. Data mining brukes vanligvis til å svare på spørsmål som hvilke hovedprodukter som kan bidra til å oppnå høy fortjeneste neste år i Wal-Mart. Data mining brukes vanligvis til å svare på spørsmål som hvilke hovedprodukter som kan bidra til å oppnå høy fortjeneste neste år i Wal-Mart. Data mining brukes vanligvis til å svare på spørsmål som hvilke hovedprodukter som kan bidra til å oppnå høy fortjeneste neste år i Wal-Mart.

OLAP er en klasse av systemer som gir svar på flerdimensjonale spørsmål. OLAP brukes vanligvis til markedsføring, budsjettering, prognoser og lignende applikasjoner. Det sier seg selv at databasene som brukes til OLAP er konfigurert for komplekse og ad hoc-spørsmål med en rask ytelse i tankene. Vanligvis brukes en matrise for å vise utdataene fra en OLAP. Radene og kolonnene er dannet av dimensjonene til spørringen. De bruker ofte metoder for aggregering på flere tabeller for å få sammendrag. For eksempel kan den brukes til å finne ut om salget i år i Wal-Mart sammenlignet med i fjor? Hva er spådommen på salget i neste kvartal? Hva kan man si om trenden ved å se på prosentvis endring?

Selv om det er åpenbart at Data mining og OLAP er like fordi de bruker data for å få intelligens, kommer hovedforskjellen fra hvordan de opererer på data. OLAP-verktøy gir flerdimensjonal dataanalyse, og de gir sammendrag av dataene, men kontrasterende fokuserer data mining på forhold, mønstre og påvirkninger i datasettet. Det er en OLAP-avtale med aggregering, som koker ned til drift av data via "tillegg", men datautvinning tilsvarer "divisjon". En annen bemerkelsesverdig forskjell er at mens data mining verktøy modellerer data og returnerer handlingsbare regler, vil OLAP gjennomføre sammenligning og kontrastteknikker langs forretningsdimensjonen i sanntid.