Mis on parketi andmevorming?
Mis on parketi andmevorming?

Video: Mis on parketi andmevorming?

Video: Mis on parketi andmevorming?
Video: Evanescence - Bring Me To Life (Official Music Video) 2024, November
Anonim

Apache Parkett on tasuta ja avatud lähtekoodiga veerule orienteeritud andmeid ladustamine vormingus Apache Hadoopi ökosüsteemist. See ühildub enamiku andmeid töötlemisraamistikud Hadoopi keskkonnas. See tagab tõhusa andmeid täiustatud jõudlusega tihendus- ja kodeerimisskeemid, mis võimaldavad keerukaid asju lahendada andmeid hulgi.

Lihtsalt, mis on parketi failivorming?

Parkett , avatud lähtekoodiga failiformaat Hadoopi jaoks. Parkett salvestab pesastatud andmestruktuure lamedas veerus vormingus . Võrreldes traditsioonilise lähenemisviisiga, kus andmeid salvestatakse reapõhises lähenemisviisis, parkett on ladustamise ja jõudluse osas tõhusam.

Pealegi, milleks parkett kasutatakse? Parkett on avatud lähtekoodiga failivorming, mis on saadaval igale Hadoopi ökosüsteemi projektile. Apache Parkett on mõeldud tõhusaks ja tulemuslikuks lameda veerukujulise andmete salvestamise vorminguks võrreldes reapõhiste failidega, nagu CSV- või TSV-failid.

Lisaks, kuidas parkettformaat andmeid salvestab?

ANDMED BLOCK Iga plokk parkett fail on ladustatud ridarühmade kujul. Niisiis, andmeid sees parkett fail on jagatud mitmeks rearühmaks. Need rearühmad koosnevad omakorda ühest või mitmest veerutükist, mis vastab veerule andmeid seatud. The andmeid iga lehtedena kirjutatud veerutüki kohta.

Kas parkett on inimestele loetav?

ORC, Parkett ja Avro on samuti masin- loetav binaarvormingus, mis tähendab, et failid näevad välja nagu jaburad inimesed . Kui vajate inimene - loetav vormingus nagu JSON või XML, siis peaksite tõenäoliselt uuesti läbi mõtlema, miks te Hadoopi üldse kasutate.

Soovitan: