Skillnad mellan Semi Join och Bloom Gå med

Anonim

Semi Join vs Bloom Gå med

Semi join och Bloom join är två samlingsmetoder som används vid förfrågningsbehandling för distribuerade databaser. Vid behandling av frågor i distribuerade databaser måste data överföras mellan databaser som finns på olika platser. Detta kan vara en dyr operation beroende på mängden data som behöver överföras. Därför är det viktigt att optimera frågorna när du behandlar frågor i en distribuerad databasmiljö för att minimera mängden data som överförs mellan webbplatser. Semi join och blom join är två metoder som kan användas för att minska mängden dataöverföring och utföra effektiv fråga behandling.

Vad är Semi Join?

Semi join är en metod som används för effektiv förfrågan bearbetning i en distribuerad databas miljö. Tänk på en situation där en anställddatabas (innehav av uppgifter som anställdas namn, avdelningsnummer hon arbetar för etc) finns på plats 1 och en avdelningsdatabas (innehavsinformation såsom avdelningsnummer, avdelningsnamn, plats etc) som finns på plats 2. Till exempel om vi vill få det anställdas namn och avdelningsnamn som hon arbetar för (endast avdelningar i "New York"), genom att utföra en fråga på en frågeprocessor på plats 3 finns det flera sätt att data kunde överföras mellan de tre platserna för att uppnå denna uppgift. Men vid överföring av data är det viktigt att notera att det inte är nödvändigt att överföra hela databasen mellan sidorna. Endast några av de attribut (eller tuples) som krävs för att gå med måste överföras mellan sidorna för att kunna utföra frågan effektivt. Semi join är en metod som kan användas för att minska mängden data som skickas mellan sidorna. I semi-anslutning överförs endast anslutningskolonnen från en plats till den andra och den överförda kolumnen används för att minska storleken på de överförda relationerna mellan de andra sidorna. För ovanstående exempel kan du bara överföra avdelningsnummer och avdelningsnamn på tomter med plats = "New York" från plats 2 till plats 1 och utföra anslutningen på plats 1 och överföra den slutliga relationen tillbaka till plats 3.

Vad är Bloom Bli medlem?

Som tidigare nämnts är Blom-medlem en annan metod som används för att undvika överföring av onödig data mellan webbplatser när man kör frågor i en distribuerad databasmiljö. I bloom join, istället för att överföra själva kolonnen för anslutning, överförs en kompakt representation av anslutningskolonnen mellan sidorna. Bloom join använder ett blomfilter som använder en bit vektor för att utföra medlemskapsfrågor. För det första byggs ett blomfilter med hjälp av kolumnen och det överförs mellan sidorna och sedan ansluts operationerna.

Vad är skillnaden mellan Semi Join och Bloom Join?

Även om både semi-join- och bloom join-metoder används för att minimera mängden data som överförs mellan sidorna när man kör frågor i en distribuerad databasmiljö, blommar med sig, reducerar mängden data som överförts i förhållande till semi-anslutningen genom att använda begreppet blomfilter, som använder en bitvektor för att bestämma uppsatta medlemskap. Därför blir det effektivare att använda blomning än att använda semi-anslutning.