Database vs Data Warehouse
Grunnlaget for forskjellen mellom en database og et datalager oppstår fra det faktum at et datalager er en type database som brukes til dataanalyse. En database er en organisert samling av data som er lagret på et datasystem. Informasjon om studenter, lærere og klasser på en skole som er lagret i tabellform er et eksempel på en database. Siden databaser støtter store mengder data, samtidig behandling og effektiv drift, blir de mye brukt. Men ettersom databasen ofte blir utsatt for oppdateringer, er det ikke mulig å ha et ordentlig syn for å gjøre en analyse. Derfor må en datalagerteknikk følges for å oppnå dette. Et datalager er en spesiell type database, men som er optimalisert for spørring og analyse. Som et datalager trekker ut data fra forskjellige kilder og rapporter,det gjør at avgjørelser kan nås ved analyse. La oss se nærmere på dem og forskjellen mellom dem her.
Hva er en database?
En database er en samling av relaterte data lagret på et datasystem. Vanligvis er en database organisert og dens data er relatert. For eksempel vil en skoledatabase ha flere tabeller som lærere, studenter og klasser der hver tabell vil ha poster som spesifiserer informasjon om hvert element. Her kan vi se strukturen er organisert basert på visse kriterier, og det er forhold mellom tabellene, ettersom de alle tilhører samme skole. En database har mange bruksområder i dataverdenen. Derfor er det så kjent at det finnes veldig rikelig i forskjellige applikasjoner. Den grunnleggende fordelen med en database er at en database kan lagre en enorm mengde data på en veldig mindre plass, samtidig som den gir veldig raske og enkle operasjoner på data.
En database involverer ofte et programvaresystem kalt Database Management System (DBMS), som er ansvarlig for å lagre og administrere dataene i databasen. MySQL, Oracle, Microsoft SQL Server er noen kjente databasestyringssystemer. Når du lager en database på datamaskinen, er første trinn å lage en logisk struktur for hvordan data lagres, organiseres og manipuleres basert på beskrivelsen vi har for systemet. Dette kalles som databasemodellering. Det finnes forskjellige modelleringsteknikker som relasjonsmodell, nettverksmodell, objektorientert modell og hierarkisk modell, men den mest kjente er relasjonsmodellen. Selv MySQL, som er et av de mest brukte databasestyringssystemene, bruker relasjonsmodellen til å lagre sine databaser.
Databasemodeller
En database støtter fire funksjoner som er gitt av akronymet CRUD som refererer til å opprette, lese, oppdatere og slette. I SQL lar du deg sette inn data i en tabell. Les lar deg spørre hva du vil hente og oppdatere, lar deg endre data når det er nødvendig. Slett lar deg slette data når de må gjøres slik.
Hva er et datavarehus?
Et datalager er en spesiell type database som brukes til analyse av data. En generell database blir vanligvis brukt til transaksjonsbehandling, og er derfor ikke optimalisert for analyse og rapportering. Men et datalager er spesialdesignet og optimalisert for analyseoppgaver. Et datalager henter vanligvis data fra historien til et transaksjonsbehandlingssystem mens forskjellige andre kilder også kan bidra. Etter å ha hentet ut data fra forskjellige kilder, rapporteres de i et generelt syn. Et transaksjonsbehandlingssystem involverer mange operasjoner per sekund, og data blir derfor ofte oppdatert, noe som gjør det vanskelig for noen å se det på et bestemt tidspunkt og analysere det for å komme til en beslutning. Et datalager muliggjør nøyaktig dette ved å trekke ut informasjon og rapportere den på en pen måte slik at man kan analysere den for å komme til en beslutning.
Hva er forskjellen mellom Database og Data Warehouse?
En database er en organisert datainnsamling. Et datalager er en spesiell type database, som er optimalisert for spørring og rapportering i stedet for transaksjonsbehandling. Så følgende sammenligning gjøres om en generell database og et datalager.
• En database lagrer nåværende data mens et datalager lagrer historiske data.
• En database endres ofte på grunn av hyppige oppdateringer som gjøres på den, og den kan derfor ikke brukes til analyse eller å treffe beslutning. Et datalager trekker ut data og rapporterer dem for å analysere og treffe beslutninger.
• En generell database brukes til online transaksjonsbehandling mens et datalager brukes til online analytisk behandling.
• Tabeller i en database normaliseres for å oppnå effektiv lagring mens et datalager vanligvis demoraliseres for å oppnå raskere spørring.
• Analytiske spørsmål er mye raskere på et datalager enn i en database.
• En database inneholder svært detaljerte data mens et datalager inneholder oppsummerte data.
• En database gir en detaljert relasjonsvisning mens et datalager gir en oppsummert flerdimensjonal visning.
• En database kan gjøre mange samtidige transaksjoner mens et datalager ikke er designet for slike oppgaver.
Sammendrag:
Datavarehus vs database
En database er en organisert samling av data som er lagret på et datasystem. Den lagrer en stor mengde data, og de endres ofte på grunn av forskjellige oppdateringer. Derfor kan den ikke brukes til en analyse for å komme til en beslutning. Så et datalager brukes. Et datalager trekker ut data fra forskjellige kilder, inkludert generelle databaser, og rapporterer dem deretter på en praktisk måte for enkelt å gjøre en analyse. En viktig forskjell er at en database inneholder nåværende data mens et datalager inneholder historiske data. En database brukes til transaksjonsbehandling mens et datalager brukes til analytisk behandling.
Bilder med tillatelse:
- Collage av fem typer databasemodeller av Marcel Douwe Dekker (CC BY-SA 3.0)
- Datalager via Wikicommons (Public Domain)