Your browser is not supported

For the best experience, use Google Chrome or Mozilla Firefox.

Программа Software University

Аналитика больших данных

Наши программы дают студентам возможность пройти обучение корпоративного уровня по доступной
цене и получить общепризнанный в отрасли сертификат.

Аналитика больших данных

Hortonworks это единственный поставщик ПО с полностью открытым исходным кодом для разработки, распределения и поддержки платформы Apache Hadoop, разработанной, созданной и протестированной специально для развертываний корпоративного уровня.

Студенты изучат основные принципы распределенной фаловой системы Hadoop, научатся понимать концепты apache hive и расширенного программирования apache hive, а также узнают, как использовать Hcatalog для объединения наборов данных в apache hive и ознакомятся с командами HDFS.

Они на практике ознакомятся с процессами импорта и экспорта данных RDBMS в HDFS, проанализируют поток данных о нажатиях и данные биржевого рынка с помощью порядковой статистики. На базе лабораторий, расположенных в облаке, студенты могут получить непосредственный опыт запуска приложения YARN, работы с apache hive, объединения наборов данных с apache pig и создания кластера HDP.

Рассматриваемые темы

  • Понимание Hadoop and распределенной файловой системы Hadoop (HDFS)
  • Список широкоиспользуемых команд HDFS
  • Шесть ключевых типов данных Hadoop
  • Таблица экспорта
  • Чем отличаются реляционные базы данных и Hadoop
  • Назначение узлов имен, узла данных, MapReduce и Reduce Phases
  • Жаргонные названия отношений и полей
  • Изучение принципов программирования с помощью PIG и HIVE
  • Выполнение внутреннего, внешнего и реплицированного объединения
release-rel-2021-8-1-6624 | Wed Jul 28 16:06:13 PDT 2021
6624
release/rel-2021-8-1-6624
Wed Jul 28 16:06:13 PDT 2021