Kāds ir Amazon Elastic MapReduce datu apstrādes dzinējs?
Kāds ir Amazon Elastic MapReduce datu apstrādes dzinējs?

Video: Kāds ir Amazon Elastic MapReduce datu apstrādes dzinējs?

Video: Kāds ir Amazon Elastic MapReduce datu apstrādes dzinējs?
Video: Introduction to Amazon Elastic MapReduce 2024, Novembris
Anonim

Amazon EMR kā izplatītāju izmanto Apache Hadoop datu apstrādes dzinējs . Hadoop ir atvērtā pirmkoda Java programmatūras ietvars, kas atbalsta datus - intensīvas izplatītas lietojumprogrammas, kas darbojas lielos klasteros no preču aparatūra.

Turklāt, kas ir Amazon Elastic MapReduce?

Amazon Elastic MapReduce ( EMR ) ir Amazon tīmekļa pakalpojumi ( AWS ) rīks lielu datu apstrādei un analīzei. Amazon EMR apstrādā lielus datus Hadoop virtuālo serveru klasterī Amazon elastīgs Aprēķināt mākoņu ( EC2 ) un Amazon Vienkāršs uzglabāšanas pakalpojums ( S3 ).

Turklāt vai Amazon EMR tiek pilnībā pārvaldīts? Tas ir pilnībā pārvaldīta datu ezera pakalpojums, kas var atsaistīt datu krātuvi no skaitļošanas resursiem un tā vietā padara skaitļošanas klasterus mērogojamus, kas ir pieejami lietošanai pēc pieprasījuma, un ietver iespēju vairākiem klasteriem piekļūt vienām un tām pašām datu kopām vienlaikus.

Var arī jautāt, kā darbojas AWS EMR?

Parasti, kad apstrādājat datus Amazon EMR , ievade ir dati, kas saglabāti kā faili jūsu izvēlētajā pamatā esošajā failu sistēmā, piemēram, Amazon S3 vai HDFS. Šie dati apstrādes secībā pāriet no viena posma uz nākamo. Pēdējā darbība ieraksta izvades datus noteiktā vietā, piemēram, Amazon S3 spainis.

Kāda ir atšķirība starp ec2 un EMR?

Atšķirībā no EMR , EC2 nenodala vergu mezglus pamata un uzdevumu mezglos. Tas palielina HDFS datu zaudēšanas risku, ja mezgls tiek noņemts/pazaudēts. EC2 izmanto Apache bibliotēkas (s3a), lai piekļūtu datiem par s3. No otras puses, EMR izmanto AWS patentētu kodu, lai ātrāk piekļūtu s3.

Ieteicams: