Programa de la Software University

Análisis de big data

Nuestros programas ofrecen a los estudiantes la ventaja de una formación a nivel corporativo a un precio asequible, y la oportunidad de obtener una certificación reconocida por la industria.

Análisis de big data

Hortonworks es el único proveedor de software de código abierto que desarrolla, distribuye y da soporte a una plataforma Apache Hadoop expresamente diseñada, creada y probada para implementaciones a nivel empresarial.

Los estudiantes dominarán los conceptos básicos del sistema de archivos distribuidos Hadoop, aprenderán a entender los conceptos de programación de apache hive y apache hive avanzado, y aprenderán a utilizar Hcatalog, uniendo los conjuntos de datos de apache hive y los comandos de HDFS.

Adquirirán experiencia práctica para importar y exportar datos de RDBMS en HDFS, analizar los datos del seguimiento de clics y analizar los datos del mercado de valores usando cuantiles. Con nuestros laboratorios en la nube, los estudiantes adquieren una experiencia práctica para ejecutar una aplicación YARN, apache hive, unir conjuntos de datos con apache pig, e iniciar un clúster HDP.

Temas tratados

  • Entender Hadoop y el sistema de archivos distribuidos Hadoop (HDFS)
  • Lista de comandos comunes del HDFS
  • Enumerar los seis tipos de datos clave de Hadoop
  • Exportar tablas
  • Distinguir entre las bases de datos relacionales y hadoop
  • Entender el propósito de los nodos de nombre, nodo de datos, MapReduce y reducir las fases
  • Enumerar los nombres de relación y los nombres de campo de Pig Latin
  • Aprender conceptos de programación usando PIG y HIVE
  • Realizar sentencias Join internas, externas y replicadas

release-rel-2020-4-1-hotfix-4132 | Fri Apr 3 01:44:21 PDT 2020
4132
release/rel-2020-4-1-hotfix-4132
Fri Apr 3 01:44:21 PDT 2020