软件大学项目

大数据分析

我们的课程为学生提供企业级培训,课程价格合理,学生还有机会获得得到行业认可的证书。

大数据分析

Hortonworks 是唯一一家 100%开源软件提供商,公司开发、发布并支持 Apache Hadoop 平台,此平台针对企业级部署进行了显式架构、构建和测试。

学生将掌握 Hadoop 分布式文件系统的核心概念,学习理解 Apache Hive 和高级 Apache Hive 编程概念,并学习使用 Hcatalog,以及在 Apache Hive 和 HDMS 命令中连接数据集。

他们将获得将 RDBMS 数据导入和导出到HDFS 的实际经验、分析点击流数据以及使用分位数分析股市数据。在云实验室的支持下,学生们可以实际运行 YARN 应用程序、Apache Hive,使用 Apache Pig 连接数据集,并启动 HDP 集群。

涵盖的主题

  • 了解 Hadoop 和 Hadoop 分布式文件系统 (HDFS)
  • 列出常见 HDFS 命令
  • 列出六种主要 Hadoop 数据类型
  • 导出表格
  • 辨别关系数据库和 Hadoop
  • 了解名称节点、数据节点、MapReduce 和Reduce Phase 的目的
  • 列出 Pig Latin 关系名称和字段名
  • 使用 PIG 和 HIVE 学习编程概念
  • 执行内连接、外连接和复制连接

release-rel-2020-4-1-hotfix-4132 | Fri Apr 3 01:44:21 PDT 2020
4132
release/rel-2020-4-1-hotfix-4132
Fri Apr 3 01:44:21 PDT 2020