Your browser is not supported

For the best experience, use Google Chrome or Mozilla Firefox.

Programme universitaire de logiciels

Analyse du Big Data

Pour les étudiants, nos programmes offrent l’avantage d’une formation de niveau d’entreprise à un prix abordable
et l’opportunité d’obtenir une certification reconnue par l’ensemble du secteur.

Analyse du Big Data

Hortonworks est le seul fournisseur de logiciel 100 % Open Source à même de développer, distribuer et prendre en charge une plate-forme Apache Hadoop explicitement architecturée, conçue et testée pour les déploiements à l’échelle de l’entreprise.

Les étudiants apprennent à maîtriser les concepts fondamentaux du système de fichiers distribués Hadoop, à mieux comprendre Apache Hive et sa programmation avancée, et à utiliser les commandes HDFS et Hcatalog pour assembler des jeux de données dans Apache Hive.

Ils apprennent par la pratique à importer et exporter des données RDBMS en HDFS, à analyser les données des flux de clics, ou encore les données boursières à l’aide des quantiles. Grâce à nos laboratoires Cloud, les étudiants mettent en pratique l’exécution d’une application YARN, l’utilisation d’Apache Hive, l’assemblage de jeux de données à l’aide d’Apache Pig et le démarrage d’un cluster HDP.

Sujets abordés

  • Comprendre Hadoop et son système de fichiers distribués (HDFS)
  • Liste des commandes HDFS courantes
  • Liste des six principaux types de données Hadoop
  • Exportation d’une table
  • Différence entre bases de données relationnelles et Hadoop
  • Comprendre le rôle des Noeuds de nom, du Noeud de données, du modèle MapReduce et des Phases de réduction
  • Liste des noms des champs et des relations Pig Latin
  • Concepts de programmation à l’aide de PIG et HIVE
  • Exécution d’un assemblage interne, externe et répliqué
release-rel-2021-8-1-6624 | Wed Jul 28 16:06:13 PDT 2021
6624
release/rel-2021-8-1-6624
Wed Jul 28 16:06:13 PDT 2021