Forskjellen Mellom Semi Join Og Bloom Join

Forskjellen Mellom Semi Join Og Bloom Join
Forskjellen Mellom Semi Join Og Bloom Join

Video: Forskjellen Mellom Semi Join Og Bloom Join

Video: Forskjellen Mellom Semi Join Og Bloom Join
Video: Lecture 47 - Semi Join in DBMS Step by Step With Examples 2024, November
Anonim

Semi Join vs Bloom Join

Semi join og Bloom join er to sammenføyningsmetoder som brukes i spørringsbehandling for distribuerte databaser. Når du behandler spørsmål i distribuerte databaser, må data overføres mellom databaser på forskjellige nettsteder. Dette kan være en kostbar operasjon avhengig av datamengden som må overføres. Derfor er det viktig å optimalisere spørringene for å minimere mengden data som overføres mellom nettsteder når du behandler spørringer i et distribuert databasemiljø. Semi join og bloom join er to metoder som kan brukes til å redusere mengden dataoverføring og utføre effektiv spørringsbehandling.

Hva er Semi Join?

Semi join er en metode som brukes for effektiv spørringsbehandling i distribuerte databasemiljøer. Tenk på en situasjon der en medarbeiderdatabase (som inneholder informasjon som ansattes navn, avdelingsnummer hun jobber for osv.) Som ligger på sted 1 og en avdelingsdatabase (som inneholder informasjon som avdelingsnummer, avdelingsnavn, sted osv.) Som ligger på stedet 2. Hvis vi for eksempel ønsker å få ansattes navn og avdelingsnavn som hun jobber for (bare avdelinger som ligger i "New York"), ved å utføre en forespørsel på en spørringsprosessor på sted 3, er det flere måter å data kan overføres mellom de tre stedene for å oppnå denne oppgaven. Men når du overfører data, er det viktig å merke seg at det ikke er nødvendig å overføre hele databasen mellom nettstedene. Bare noen av attributtene (eller tuplene) som kreves for sammenkoblingen, må overføres mellom nettstedene for å utføre spørringen effektivt. Semi join er en metode som kan brukes til å redusere mengden data som sendes mellom nettstedene. I semi-sammenkobling overføres bare koblingskolonnen fra det ene nettstedet til det andre, og deretter brukes den overførte kolonnen for å redusere størrelsen på de sendte relasjonene mellom de andre nettstedene. For eksemplet ovenfor kan du bare overføre avdelingsnummeret og avdelingsnavnet til tuplene med plassering =”New York” fra side 2 til side 1 og utføre sammenkoblingen på side 1 og overføre den endelige relasjonen tilbake til side 3.bare sammenføyningskolonnen overføres fra ett sted til det andre, og deretter blir den overførte kolonnen brukt til å redusere størrelsen på de sendte forholdene mellom de andre nettstedene. For eksemplet ovenfor kan du bare overføre avdelingsnummeret og avdelingsnavnet til tuplene med plassering =”New York” fra side 2 til side 1 og utføre sammenkoblingen på side 1 og overføre den endelige relasjonen tilbake til side 3.bare sammenføyningskolonnen overføres fra ett sted til det andre, og deretter blir den overførte kolonnen brukt til å redusere størrelsen på de sendte forholdene mellom de andre nettstedene. For eksemplet ovenfor kan du bare overføre avdelingsnummeret og avdelingsnavnet til tuplene med plassering =”New York” fra side 2 til side 1 og utføre sammenkoblingen på side 1 og overføre den endelige relasjonen tilbake til side 3.

Hva er Bloom Join?

Som nevnt tidligere er blomstring en annen metode som brukes for å unngå overføring av unødvendige data mellom nettsteder når du utfører spørsmål i et distribuert databasemiljø. I blomstre blir, i stedet for å overføre selve sammenføyningskolonnen, en kompakt representasjon av sammenføyningskolonnen overført mellom nettstedene. Bloom join bruker et blomstringsfilter som bruker litt vektor for å utføre medlemsforespørsler. For det første bygges et blomstringsfilter ved hjelp av sammenføyningskolonnen, og det overføres mellom stedene, og deretter utføres sammenføyningsoperasjonene.

Hva er forskjellen mellom Semi Join og Bloom Join?

Selv om både semi-join- og bloom-join-metoder brukes til å minimere mengden data som overføres mellom nettstedene når du utfører spørringer i et distribuert databasemiljø, reduserer bloom join mengden data (antall tuples) som er overført sammenlignet med semi-join ved å bruke begrepet blomstringsfiltre, som bruker litt vektor for å bestemme angitt medlemskap. Derfor vil det være mer effektivt å bruke blomstring enn å bruke semi-sammenføyning.

Anbefalt: