Kas ir datu straumēšana pakalpojumā Hadoop?
Kas ir datu straumēšana pakalpojumā Hadoop?

Video: Kas ir datu straumēšana pakalpojumā Hadoop?

Video: Kas ir datu straumēšana pakalpojumā Hadoop?
Video: What is Data Streaming? 2024, Novembris
Anonim

Hadoop straumēšana . Hadoop straumēšana ir utilīta, kas nāk komplektā ar Hadoop izplatīšana. Lietderība ļauj izveidot un palaist Kartes/samazināt darbus ar jebkuru izpildāmo failu vai skriptu kā kartētāju un/vai reducētāju.

Ir arī jāzina, kas tiek straumēts pakalpojumā Hadoop?

Hadoop straumēšana ir vispārīga API, kas ļauj rakstīt kartētājus un samazinājumus jebkurā valodā. Bet pamatkoncepcija paliek nemainīga. Kartētāji un reducētāji saņem ievadi un izvadi stdin un stdout kā (atslēgas, vērtības) pārus. Apache Hadoop lietojumiem straumes saskaņā ar UNIX standartu starp jūsu lietojumprogrammu un Hadoop sistēma.

kas ir pakešu un straumēšanas dati? A partija ir kolekcija datus punkti, kas ir sagrupēti noteiktā laika intervālā. Vēl viens bieži lietots termins ir logs datus . Straumēšana apstrāde nodarbojas ar nepārtrauktu datus un tas ir galvenais, lai kļūtu liels datus ātri datus.

Tāpat, ko nozīmē datu straumēšana?

Datu straumēšana ir datus ko nepārtraukti ģenerē dažādi avoti. Tādas datus jāapstrādā pakāpeniski, izmantojot Straume Apstrādes metodes bez piekļuves visiem datus . To parasti izmanto lielo kontekstā datus kurā to lielā ātrumā ģenerē daudzi dažādi avoti.

Kur atrodas Hadoop straumes burka?

The Hadoop straumēšanas burka joprojām ir pieejams jaunākajā EMR laidienā Hadoop . Sākot ar EMR versiju 4.0. 0 to var atrast vietnē /usr/lib/ hadoop - mapreduce / hadoop - straumēšana.

Ieteicams: