Programme Software University

Big Data Analytics

Pour les étudiants, nos programmes offrent les avantages d'une formation de niveau d'entreprise à un prix abordable et l'opportunité d'obtenir une certification reconnue par l'ensemble de l'industrie.

Big Data Analytics

Hortonworks est le seul fournisseur de logiciel 100 % Open Source à même de développer, distribuer et prendre en charge une plateforme Apache Hadoop explicitement architecturée, conçue et testée pour les déploiements à l'échelle de l'entreprise.

Les étudiants apprendront à maîtriser les concepts fondamentaux du système de fichiers distribués Hadoop, à mieux comprendre Apache Hive et sa programmation avancée, et à utiliser les commandes HDFS et Hcatalog pour assembler des jeux de données dans Apache Hive.

Ils apprendront par la pratique à importer et exporter des données de SGBDR dans HDFS, à analyser les données des flux de clics, ou encore les données boursières à l'aide des quantiles. Grâce à nos laboratoires Cloud, les étudiants mettent en pratique l'exécution d'une application YARN, d'Apache Hive, à assembler des jeux de données à l'aide d'Apache Pig et à démarrer un cluster HDP.

Sujets couverts

  • Hadoop et son système de fichiers distribués (HDFS)
  • Commandes HDFS courantes
  • Les six principaux types de données Hadoop
  • Exportation d'une table
  • Différence entre bases de données relationnelles et Hadoop
  • Objectif des Nœuds de nom, du Nœud de données, du modèle MapReduce et des Phases de réduction
  • Liste des noms des champs et des relations Pig Latin
  • Concepts de programmation à l'aide de PIG et HIVE
  • Exécution d'une jointure interne, externe et répliquée

release-rel-2020-6-2-4672 | Wed Jun 24 12:30:09 PDT 2020
4672
release/rel-2020-6-2-4672
Wed Jun 24 12:30:09 PDT 2020