Mis on Impala suurandmetes?
Mis on Impala suurandmetes?

Video: Mis on Impala suurandmetes?

Video: Mis on Impala suurandmetes?
Video: Tame Impala - Mind Mischief (Official Audio) 2024, Mai
Anonim

Impala on avatud lähtekoodiga massiliselt paralleelse töötlemise päringumootor, mis asub rühmitatud süsteemide (nt Apache Hadoop) peal. See loodi Google'i Dremeli paberi põhjal. See on interaktiivne SQL-i sarnane päringumootor, mis töötab Hadoopi hajutatud failisüsteemi (HDFS) peal. Impala kasutab alusmäluna HDFS-i.

Mis on sellega seoses Impala ja taru?

Apache Taru on tõhus standard SQL-in-Hadoop jaoks. Impala on avatud lähtekoodiga SQL-i päringumootor, mis on välja töötatud pärast Google Dremeli. Cloudera Impala on SQL-mootor HBase'is ja HDFS-is salvestatud andmete töötlemiseks. Impala kasutab Taru megastore ja saab päringuid teha Taru tabelid otse.

Lisaks, kumb on parem taru või Impala? Apache Taru ei pruugi olla ideaalne interaktiivseks andmetöötluseks Impala on mõeldud interaktiivseks andmetöötluseks. Taru on partiipõhine Hadoop MapReduce, samas kui Impala on rohkem nagu MPP andmebaas. Taru toetab keerulisi tüüpe, kuid Impala ei ole. Apache Taru on tõrketaluv, samas kui Impala ei toeta veataluvust.

Samuti küsiti, miks me Impalat kasutame?

Impala toetab mälusisest andmetöötlust, st pääseb juurde/analüüsib andmeid, mis on salvestatakse Hadoopi andmesõlmedesse ilma andmete liikumiseta. Sa saad juurdepääsu andmetele kasutades Impala kasutades SQL-i sarnased päringud. Impala pakub teiste SQL-mootoritega võrreldes kiiremat juurdepääsu HDFS-i andmetele.

Mis on suurandmetes taru?

Apache Taru on andmeid jaoks laosüsteem andmeid kokkuvõtete tegemiseks ja analüüsiks ning suurte päringute tegemiseks andmeid süsteemid avatud lähtekoodiga Hadoopi platvormil. See teisendab SQL-i sarnased päringud MapReduce'i töödeks, et hõlbustada ülisuurte mahtude käitamist ja töötlemist. andmeid.

Soovitan: