Programma Software University

Analisi dei big data

I nostri programmi offrono agli studenti il vantaggio di formarsi a livello aziendale a un costo accessibile e l'opportunità di ottenere una certificazione riconosciuta nel settore.

Analisi dei big data

Hortonworks è l'unico fornitore di software completamente open source per sviluppare, distribuire e supportare una piattaforma Apache Hadoop esplicitamente architettata, costruita e testata per le distribuzioni a livello aziendale.

Gli studenti padroneggeranno il file system distribuito di Hadoop, impareranno a capire apache hive e i concetti di programmazione avanzata apache hive, nonché impareranno come utilizzare Hcatalog e unire i set di dati in apache hive e nei comandi HDFS.

Riceveranno esperienza pratica relativamente all'importazione ed esportazione dei dati RDBMS in HDFS, all'analisi dei dati clickstream e i dati delle borse mediante l'utilizzo dei quantili. Con i nostri laboratori cloud, gli studenti ricevono un'esperienza pratica per eseguire un'applicazione YARN, apache hive, unire i data set con apache pig e iniziare un raggruppamento HDP.

Argomenti trattati

  • Capire Hadoop e il File System distribuito di Hadoop (HDFS)
  • Elencare i comuni comandi HDFS
  • Elencare i sei tipi di dati Hadoop principali
  • Esportare tabelle
  • Distinguere i database razionali da Hadoop
  • Capire gli scopi dei nodi del nome, il nodo dei dati, Mapreduce e le fasi reduce
  • Elencare i nomi delle relazioni pig latin e i nomi di campo
  • Imparare i concetti di programmazione utilizzando PIG e HIVE
  • Eseguire Inner, Outer e Replicated Join

release-rel-2020-8-1-hotfix-4896 | Fri Aug 7 09:16:14 PDT 2020
4896
release/rel-2020-8-1-hotfix-4896
Fri Aug 7 09:16:14 PDT 2020