cloudera 授权 Apache Hadoop 开发员培训
Developer Training for Apache Hadoop
Cloudera 的 Apache Hadoop 培训和认证使你的知识迈上新台阶
Cloudera University 四天的开发员培训课程传达了关键概念和技术,给学员创造使用 Hadoop 的稳健数据分析处理应用。从工作流实现和 APIs 工作到写 MapReduce 代码,Cloudera 的培训课程都是 Hadoop 开发员应对实时挑战最好的准备。
使用 Hadoop
通过指导性的讨论互动和实践,学员将使用 Hadoop 生态系统学习到如下内容:
MapReduce 和 HDFS 核心以及如何书写 MapReduce 代码
Hadoop 发展,调试,工作流实现和常见算法的实践
如何平衡 Hive,Pig,Sqoop,Flume,Oozie,Mahout 和其他 Hadoop 生态系统项目
最佳硬件配置和网络把 hadoop 嵌入数据中心
如何用 MapReduce 来联结数据集
实时数据分析的先进 hadoop API 主题
开发员认证
完成培训的学员将获得 Cloudera Certified Developer for Apache Hadoop (CCDH) 模拟考试机会,这个认证会帮助你成为这个领域的领导者,给雇主和客户带去切实的技术和专长上的验证。
参训相关信息
课程时长:4天
学员基础
本课程适合于具备编程经验的开发员和工程师,尤其需要 Java 方面的技能和经验
授课形式
采取教师讲解和学员上机操作相结合的形式。上机实验有机地穿插在重要课题讲解后,学员能马上学以致用,巩固刚刚所学的概念和知识,转化为自身的技能应用到实战中。我们鼓励学员在课堂上大胆自由地提问,和授课教师进行互动,获得最大的收益。
认证考试
Cloudera Apache Hadoop 资格开发员考试提供 Hadoop 上软件开发在业界唯一且最具权威性、并得到全球认可的认证。为企业提供高质量保证的 Hadoop 开发人员;为工程师技术人员提供了最新的技术装备,开拓了职业发展。
课程内容纲要
Hadoop 动机
Problems with Traditional
Large-Scale Systems
Introducing Hadoop
Hadoopable Problems
Hadoop 基本概念和 HDFS
The Hadoop Project and Hadoop Components
The Hadoop Distributed File System
MapReduce 介绍
MapReduce Overview
Example: WordCount
Mappers
Reducers
Hadoop 集群和 Hadoop 生态系统
Hadoop Cluster Overview
Hadoop Jobs and Tasks
Other Hadoop Ecosystem Components
使用 Java 编写 MapReduce 程序
Basic MapReduce API Concepts
Writing MapReduce Drivers, Mappers, and Reducers in Java
Speeding Up Hadoop Development by Using Eclipse
Differences Between the Old and New MapReduce APIs
使用 Streaming 编写 MapReduce 程序
Writing Mappers and Reducers with the Streaming API
MapReduce 单元测试
Unit Testing
The JUnit and MRUnit Testing Frameworks
Writing Unit Tests with MRUnit
Running Unit Tests
深入 Hadoop API
Using the ToolRunner Class
Setting Up and Tearing Down Mappers and Reducers
Decreasing the Amount of Intermediate Data with Combiners
Accessing HDFS Programmatically
Using The Distributed Cache
Using the Hadoop API’s Library of Mappers, Reducers and Partitioners
开发技巧
Strategies for Debugging MapReduce Code
Testing MapReduce Code Locally by Using LocalJobRunner
Writing and Viewing Log Files
Retrieving Job Information with Counters
Reusing Objects
Creating Map-Only MapReduce Jobs
Reducer 和 Partitioner
How Partitioners and Reducers Work Together
Determining the Optimal Number of Reducers for a Job
Writing Customer Partitioners
数据输入/输出
Creating Custom Writable and Writable-Comparable Implementations
Saving Binary Data Using SequenceFile and Avro Data Files
Issues to Consider When Using File Compression
Implementing Custom InputFormats and OutputFormats