Sisukord:

Kas ma saan Pythonit Hadoopis käivitada?
Kas ma saan Pythonit Hadoopis käivitada?

Video: Kas ma saan Pythonit Hadoopis käivitada?

Video: Kas ma saan Pythonit Hadoopis käivitada?
Video: 29 WORST Heart & Artery Foods To Avoid [🔄 REVERSE Clogged Arteries!] 2024, November
Anonim

Valikus on programmeerimiskeelte nagu Java, Scala ja Python jaoks Hadoop ökosüsteem, kasutab enamik arendajaid Python tänu oma andmeanalüütiliste ülesannete jaoks mõeldud raamatukogudele. Hadoop voogesitus võimaldab kasutajal luua ja hukata Tööde kaardistamine/vähendamine mis tahes skripti või käivitatava failiga kaardistajana või/või redutseerijana.

Samamoodi küsitakse, kuidas Python Hadoopiga ühenduse loob?

Hadoop HDFS-i ühendamine Pythoniga

  1. 1. samm: veenduge, et Hadoop HDFS töötab õigesti. Avage terminal/käsuviip, kontrollige, kas HDFS töötab, kasutades järgmisi käske: start-dfs.sh.
  2. 2. samm: installige libhdfs3 teek.
  3. 3. samm: installige hdfs3 teek.
  4. 4. samm: kontrollige, kas ühendus HDFS-iga on edukas.

Samamoodi, mis on Pythonis Hadoop? Python on üldotstarbeline terviklik programmeerimiskeel, millega saab programmeerimismaailmas teha peaaegu kõike. Hadoop on Java keeles kirjutatud suurandmete raamistik tohutute andmemahtude töötlemiseks. Internetis on palju instituute, mis Hadoop koos Python kursused nagu: Analytixlabs. Edureka.

Seejärel tekib küsimus, kuidas käivitada Python MapReduce programmi Hadoopis?

Hadoop MapReduce programmi kirjutamine Pythonis

  1. Motivatsioon.
  2. Mida me tahame teha.
  3. Eeldused.
  4. Python MapReduce kood. Kaardi samm: mapper.py. Vähenda sammu: reduktor.py.
  5. Pythoni koodi käitamine Hadoopis. Laadige alla näidissisendandmed. Kopeerige kohalikud näidisandmed HDFS-i.
  6. Täiustatud kaardistamis- ja reduktorkood: Pythoni iteraatorite ja generaatorite kasutamine. kaardistaja.py. reduktor.py.

Mis on Hadoop Streaming jar?

Hadoop distributsioon pakub Java utiliiti nimega Hadoopi voogesitus . See on pakendatud a purk faili. Koos Hadoopi voogesitus , saame käivitatava skriptiga luua ja käivitada Map Reduce'i töid. Hadoopi voogesitus on utiliit, mis on kaasas Hadoop levitamine. Seda saab kasutada suurte andmete analüüsimiseks mõeldud programmide käivitamiseks.

Soovitan: