Kas ir AWS MapReduce?
Kas ir AWS MapReduce?

Video: Kas ir AWS MapReduce?

Video: Kas ir AWS MapReduce?
Video: Create and Execute MapReduce in Eclipse 2024, Novembris
Anonim

Amazon elastīgs MapReduce (EMR) ir Amazon Web Services ( AWS ) rīks lielu datu apstrādei un analīzei. Amazon EMR apstrādā lielus datus Hadoop virtuālo serveru klasterī Amazon Elastic Compute Cloud (EC2) un Amazon Simple Storage Service (S3).

Kā šādā veidā darbojas AWS EMR?

Pakalpojums palaiž klienta norādītu skaitu Amazon EC2 gadījumu, kas sastāv no viena galvenā un vairākiem citiem mezgliem. Amazon EMR šajos gadījumos palaiž Hadoop programmatūru. Galvenais mezgls sadala ievades datus blokos un sadala bloku apstrādi citiem mezgliem.

Papildus iepriekš minētajam, kāda ir atšķirība starp ec2 un EMR? Atšķirībā no EMR , EC2 nenodala vergu mezglus pamata un uzdevumu mezglos. Tas palielina HDFS datu zaudēšanas risku, ja mezgls tiek noņemts/pazaudēts. EC2 izmanto Apache bibliotēkas (s3a), lai piekļūtu datiem par s3. No otras puses, EMR izmanto AWS patentētu kodu, lai ātrāk piekļūtu s3.

Turklāt vai AWS EMR tiek pilnībā pārvaldīts?

Amazon Elastīgā MapReduce ( EMR ) ir pilnībā pārvaldīta Hadoop un Spark platforma no Amazon Web pakalpojums ( AWS ). Ar EMR , AWS klienti var ātri izveidot vairāku mezglu Hadoop klasterus, lai apstrādātu lielu datu darba slodzi.

Vai AWS izmanto Hadoop?

Amazon Tīmekļa pakalpojumi lietojumiem atvērtā koda Apache Hadoop izplatīta skaitļošanas tehnoloģija, lai atvieglotu piekļuvi lielam skaitļošanas jaudas apjomam datu ietilpīgu uzdevumu veikšanai. Hadoop , Google MapReduce atvērtā pirmkoda versiju, jau izmanto tādi uzņēmumi kā Yahoo un Facebook.

Ieteicams: