Satura rādītājs:

Kā es varu uzlabot savu sqoop veiktspēju?
Kā es varu uzlabot savu sqoop veiktspēju?

Video: Kā es varu uzlabot savu sqoop veiktspēju?

Video: Kā es varu uzlabot savu sqoop veiktspēju?
Video: Kā uzlabot mentālo veselību: 8 ieteikumi jauniešiem | Maxima TV 2024, Novembris
Anonim

Lai optimizētu sniegumu , komplekts uz Kartes uzdevumu skaits līdz vērtībai, kas ir mazāka par uz maksimālais savienojumu skaits, kas uz datubāze atbalsta. Kontrolējot uz paralēlisma daudzums, kas Sqoop izmantos datu pārsūtīšanai uz galvenais kontroles veids uz slodze uz jūsu datu bāze.

Attiecīgi, kas notiek, ja sqoop neizdodas procesa starplaikā?

Tipisks Sqoop darbs, kas pārņem datus no avota datu bāzes HDFS, kopēs datus mērķa direktorijā. Kopētais fails tiks dzēsts ja sqoop neizdodas nepabeidzot.

Var arī jautāt, kā panākt paralēlismu sqoop? Kontrolējot Paralēlisms . Sqoop paralēli importē datus no vairuma datu bāzes avotu. Varat norādīt kartes uzdevumu (paralēlo procesu) skaitu, kas jāizmanto, lai veiktu importēšanu, izmantojot argumentu -m vai --num-mappers. Katram no šiem argumentiem ir vesela skaitļa vērtība, kas atbilst pakāpei paralēlisms nodarbināt

Līdz ar to kā es varu uzlabot savu Hive vaicājumu veiktspēju?

Tālāk ir sniegts to prakšu saraksts, kuras mēs varam ievērot, lai optimizētu Hive vaicājumus

  1. Iespējot saspiešanu programmā Hive.
  2. Optimizēt pievienojas.
  3. Izvairieties no globālās šķirošanas stropā.
  4. Iespējot Tez Execution Engine.
  5. Optimizēt LIMIT operatoru.
  6. Iespējot paralēlo izpildi.
  7. Iespējot Mapreduce Strict režīmu.
  8. Single Reduce for Multi Group BY.

Kā darbojas sqoop split?

To var izmantot, lai uzlabotu importēšanas veiktspēju, panākot lielāku paralēlismu. Sqoop rada sadalās pamatojoties uz vērtībām noteiktā tabulas kolonnā, ko norāda -- sadalīt - lietotājs, izmantojot importēšanas komandu. Ja tā nav pieejama, ievades tabulas primārā atslēga tiek izmantota, lai izveidotu sadalās.

Ieteicams: