Mis on AWS MapReduce?
Mis on AWS MapReduce?

Video: Mis on AWS MapReduce?

Video: Mis on AWS MapReduce?
Video: AWS re:Invent 2015 | (BDT316) Offloading ETL to Amazon Elastic MapReduce 2024, Mai
Anonim

Amazon elastne MapReduce (EMR) on Amazoni veebiteenused ( AWS ) suurandmete töötlemise ja analüüsi tööriist. Amazon EMR töötleb suurandmeid Hadoopi virtuaalserverite klastri kaudu teenuses Amazon Elastic Compute Cloud (EC2) ja Amazon Simple Storage Service (S3).

Kuidas sel viisil AWS EMR töötab?

Teenus käivitab kliendi määratud arvu Amazon EC2 eksemplare, mis koosnevad ühest põhi- ja mitmest muust sõlmest. Amazon EMR käitab nendel juhtudel Hadoopi tarkvara. Peasõlm jagab sisendandmed plokkideks ja jagab plokkide töötlemise teistele sõlmedele.

Lisaks ülaltoodule, mis vahe on ec2 ja EMR vahel? Erinevalt EMR , EC2 ei kategoriseeri alluvaid sõlmi põhi- ja ülesandesõlmedeks. See suurendab HDFS-andmete kaotamise ohtu, kui sõlm eemaldatakse/kaotatakse. EC2 kasutab s3 andmetele juurdepääsuks Apache teeke (s3a). Teiselt poolt, EMR kasutab s3-le kiirema juurdepääsu saamiseks AWS-i patenteeritud koodi.

Pealegi, kas AWS EMR on täielikult hallatud?

Amazon Elastic MapReduce ( EMR ) on täielikult juhitud Hadoopi ja Sparki platvorm alates Amazon Veebiteenus ( AWS ). Koos EMR , AWS kliendid saavad suurte andmemahtude töötlemiseks kiiresti luua mitme sõlmega Hadoopi klastreid.

Kas AWS kasutab Hadoopi?

Amazon Veebiteenused kasutab avatud lähtekoodiga Apache Hadoop hajutatud andmetöötlustehnoloogia, et hõlbustada juurdepääsu suurele arvutusvõimsusele andmemahukate ülesannete täitmiseks. Hadoop , Google'i MapReduce'i avatud lähtekoodiga versiooni, kasutavad juba sellised ettevõtted nagu Yahoo ja Facebook.

Soovitan: