Sisukord:

Kuidas ma saan oma sqoopi jõudlust parandada?
Kuidas ma saan oma sqoopi jõudlust parandada?

Video: Kuidas ma saan oma sqoopi jõudlust parandada?

Video: Kuidas ma saan oma sqoopi jõudlust parandada?
Video: Как использовать Bixby 2024, Aprill
Anonim

Optimeerimiseks esitus , komplekt a kaardiülesannete arv väärtuseni, mis on väiksem kui a maksimaalne ühenduste arv a andmebaas toetab. Kontrollimine a paralleelsuse hulk, et Sqoop mida kasutatakse andmete edastamiseks a peamine viis kontrollimiseks a laadige peale sinu andmebaasi.

Mis juhtub siis, kui sqoop mõne protsessi vahel ebaõnnestub?

Tüüpiline Sqoop töö, mis seob andmeid lähteandmebaasist HDFS-i, kopeerib andmed sihtkataloogi. Kopeeritud fail kustutatakse kui sqoop ebaõnnestub lõpetamata.

Võib ka küsida, kuidas saavutada sqoopis paralleelsus? Kontrollimine Paralleelsus . Sqoop impordib andmeid paralleelselt enamikust andmebaasiallikatest. Argumendi -m või --num-mappers abil saate määrata importimisel kasutatavate vastendusülesannete (paralleelprotsesside) arvu. Kõik need argumendid võtavad täisarvu, mis vastab astmele paralleelsus tööle võtta

Järelikult, kuidas ma saan oma Hive päringu toimivust parandada?

Allpool on loetelu tavadest, mida saame Hive päringute optimeerimiseks järgida

  1. Luba tarus tihendamine.
  2. Optimeeri liitumised.
  3. Vältige tarus globaalset sorteerimist.
  4. Lubage Tez Execution Engine.
  5. Optimeeri LIMIT operaatorit.
  6. Luba paralleelkäivitus.
  7. Lubage Mapreduce'i range režiim.
  8. Ühekordne vähendamine Multi Group BY jaoks.

Kuidas sqoop split töötab?

Seda saab kasutada impordi jõudluse parandamiseks, saavutades suurema paralleelsuse. Sqoop loob lõheneb põhinevad väärtustel tabeli konkreetses veerus, mille määrab -- poolitatud -kasutaja poolt impordikäsu kaudu. Kui see pole saadaval, kasutatakse sisendtabeli primaarvõtit selle loomiseks lõheneb.

Soovitan: