Software University-Programm

Big Data-Analyse

Unsere Programme bieten Studenten den Vorteil einer Ausbildung auf Unternehmensniveau zu einem erschwinglichen Preis und die Möglichkeit, eine branchenweit anerkannte Zertifizierung zu erwerben.

Big Data-Analyse

Hortonworks ist der einzige Anbieter von 100%-Open-Source-Software, der eine Apache-Hadoop-Plattform entwickelt, vertreibt und unterstützt, die explizit für den Einsatz in Unternehmen konzipiert, aufgebaut und getestet wurde.

Die Teilnehmer erlernen die Kernkonzepte des verteilten Dateisystems Hadoop, grundlegende und fortgeschrittene Konzepte der Apache-Hive-Programmierung sowie die Verwendung von Hcatalog zur Verknüpfung von Datensätzen in Apache Hive über HDFS-Befehle.

Sie sammeln praktische Erfahrungen beim Import und Export von RDBMS-Daten in HDFS sowie bei der Analyse von Clickstream-Daten und Börsendaten mit Hilfe von Quantilen. In unseren Cloud-Labs können Studenten praktische Erfahrungen mit der Ausführung von YARN-Anwendungen, Apache Hive, dem Zusammenführen von Datensätzen mit Apache Pig sowie dem Anlegen von HDP-Clustern sammeln.

Behandelte Themen

  • Hadoop und das Hadoop Distributed File System (HDFS) verstehen
  • Auflistung häufiger HDFS-Befehle
  • Auflistung der sechs wichtigsten Hadoop-Datentypen
  • Tabellen exportieren
  • Unterscheidung zwischen relationalen Datenbanken und Hadoop
  • Den Zweck von NameNodes, DataNodes, MapReduce und Reduce-Phasen verstehen
  • Auflistung von Relations- und Feldnamen in Pig Latin
  • Konzepte der Programmierung mit PIG und HIVE erlernen
  • Inner, Outer und Replicated Join ausführen

release-rel-2020-3-2-3995 | Wed Mar 18 12:30:18 PDT 2020
3995
release/rel-2020-3-2-3995
Wed Mar 18 12:30:18 PDT 2020