Kuidas Hadoopis andmete lokaliseerimine saavutatakse?
Kuidas Hadoopis andmete lokaliseerimine saavutatakse?

Video: Kuidas Hadoopis andmete lokaliseerimine saavutatakse?

Video: Kuidas Hadoopis andmete lokaliseerimine saavutatakse?
Video: Kuidas teha varukoopiaid? 2024, Mai
Anonim

Andmete lokaliseerimine sisse Hadoop . Võtke näiteks Wordcount näide, kus enamik sõnu on korratud 5 Lacsi või rohkem korda. Sel juhul on pärast kaardistamise faasi igas kaardistaja väljundis sõnad vahemikus 5 Laci. Seda täielikku protsessi Mapperi väljundi LFS-i salvestamiseks nimetatakse Andmete lokaliseerimine.

Seda silmas pidades, mis on andmete lokaliseerimine Hadoopis?

Mõiste Andmed paikkond sisse Hadoopi andmed paikkond sisse MapReduce viitab võimalusele viia arvutus tegeliku asukoha lähedale andmeid asub sõlmel, selle asemel, et liikuda suurelt andmeid arvutamisele. See vähendab võrgu ülekoormust ja suurendab süsteemi üldist läbilaskevõimet.

Lisaks, kuidas suurandmeid salvestatakse? Enamik inimesi seostab HDFS-i ehk Hadoopi hajutatud failisüsteemi automaatselt Hadoopiga andmeid laod. HDFS salvestab teabe klastritesse, mis koosnevad väiksematest plokkidest. Need plokid on ladustatud kohapeal füüsilises ladustamine seadmed, näiteks sisemised kettaseadmed.

Nii, kuidas andmeid Hadoopis salvestatakse?

Peal Hadoop klaster, andmeid HDFS-is ja MapReduce-süsteemis asuvad kõik klastri masinad. Andmed on ladustatud sisse andmeid plokid DataNodes. HDFS kordab neid andmeid plokke, tavaliselt 128 MB, ja jaotab need laiali nii, et neid kopeeritakse klastri mitmes sõlmes.

Kuidas faile HDFS-is salvestatakse?

HDFS paljastab a faili süsteemi nimeruum ja võimaldab kasutajaandmetel olla ladustatud sisse failid . Sisemiselt a faili on jagatud üheks või mitmeks plokiks ja need plokid on ladustatud DataNode'ide komplektis. NameNode käivitub faili süsteemi nimeruumi toimingud, nagu avamine, sulgemine ja ümbernimetamine failid ja kataloogid.

Soovitan: