Kā Hadoop tiek nodrošināta datu lokalizācija?
Kā Hadoop tiek nodrošināta datu lokalizācija?

Video: Kā Hadoop tiek nodrošināta datu lokalizācija?

Video: Kā Hadoop tiek nodrošināta datu lokalizācija?
Video: Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn 2024, Maijs
Anonim

Datu lokalizācija iekšā Hadoop . Ņemiet paraugu Wordcount piemēru, kur lielākā daļa vārdu ir atkārtoti 5 Laci vai vairāk reizes. Tādā gadījumā pēc kartētāja fāzes katrā kartētāja izvadē būs vārdi diapazonā no 5 Lacs. Šis pilnīgais Mapper izvades saglabāšanas process LFS tiek saukts par Datu lokalizācija.

Ņemot to vērā, kas ir datu lokalizācija Hadoop?

Jēdziens par Dati apvidus iekšā Hadoop dati apvidus iekšā MapReduce attiecas uz spēju pārvietot aprēķinu tuvu faktiskajai vietai datus atrodas uz mezgla, nevis pārvietojas liels datus uz aprēķinu. Tas samazina tīkla pārslodzi un palielina sistēmas kopējo caurlaidspēju.

Kā arī tiek glabāti lielie dati? Lielākā daļa cilvēku automātiski saista HDFS jeb Hadoop izplatīto failu sistēmu ar Hadoop datus noliktavas. HDFS glabā informāciju klasteros, kas sastāv no mazākiem blokiem. Šie bloki ir glabājas uz vietas fiziskajā uzglabāšana vienības, piemēram, iekšējie diskdziņi.

Tātad, kā dati tiek glabāti Hadoop?

Uz Hadoop klasteris, datus HDFS un MapReduce sistēma ir izvietota katrā klastera iekārtā. Dati ir glabājas iekšā datus bloki DataNodes. HDFS tos atkārto datus blokus, parasti 128 MB, un sadala tos tā, lai tie tiktu replicēti vairākos mezglos visā klasterī.

Kā faili tiek saglabāti HDFS?

HDFS atmasko a failu sistēmas nosaukumvieta un ļauj būt lietotāja datiem glabājas iekšā failus . Iekšēji, a failu ir sadalīts vienā vai vairākos blokos, un šie bloki ir glabājas DataNodes komplektā. Tiek izpildīts NameNode failu sistēmas nosaukumvietas darbības, piemēram, atvēršana, aizvēršana un pārdēvēšana failus un katalogi.

Ieteicams: