banner-big-data

大数据培训课程

课程介绍

培训对象:

对云计算、分布式数据存储于处理、大数据等感兴趣的朋友
传统的数据库,例如 Oracle、MaySQL、DB2 等的管理人员
Java、C 等任意一门编程语言的开发者
网站服务器端的开发人员
在校大学生、中专生或者刚毕业的学生
云计算大数据从业者
熟悉 Hadoop 生态系统,想了解和学习 Hadoop 与 Spark 整合在企业应用实战案例的朋友
系统架构师、系统分析师、高级程序员、资深开发人员
牵涉到大数据处理的数据中心运行、规划、设计负责人
政府机关,金融保险、移动和互联网等大数据来源单位的负责人
高校、科研院所涉及到大数据与分布式数据处理的项目负责人
数据仓库管理人员、建模人员,分析和开发人员、系统管理人员、数据库管理人员以及对数据仓库感兴趣的其他人员

培训目标:

了解大数据时代的基础技术和思维
体会大数据驱动下的营销变革与实战分享
能从电子商务等新型企业的大数据应用情况和案例中理解大数据价值
分享大数据应用案例,培养听众对大数据挖掘与分析的认识
掌握以 Hadoop 为代表的大数据平台实现技术能力

课程内容纲要

第1个主题:大数据生态圈和案例介绍

1. 认识大数据(大数据时代的思维,价值体现是什么,大数据应用的热点、发展、展望)
2. 大数据与云计算(大数据与云计算的关系是什么,大数据云计算的应用和领域)
3. 大数据技术概述(大数据技术的分类有哪些,大数据的主流技术有哪些)
4. 国外、国内大数据应用情况现状以及发展方向(其他行业大数据案例分享,国内大型互联网公司案例分享)

第2个主题:Hadoop 三问(彻底理解 Hadoop)

1. Hadoop 为什么是云计算分布式大数据的事实开源标准软件框架?
2. Hadoop 的具体是如何工作?
3. Hadoop 的生态架构和每个模块具体的功能是什么?

第3个主题:彻底掌握 HDFS(深入理解 HDFS)

1. HDFS 体系架构剖析
2. 名称节点、数据节点、辅助名称节点架构
3. 名称节点的高可靠性最佳实践
4. 数据节点中 Block 划分的原理和具体存储方式

第4个主题:彻底掌握 MapReduce(剖析 MapReduce 执行)

1. MapReduce 执行的经典步骤
2. wordcount 运行过程解析
3. Mapper 和 Reducer 剖析

第5个主题:YARN(理解和使用 YARN)

1. YARN 的设计思想
2. YARN 的核心组件
3. YARN 的共组过程
4. YARN 应用程序编写

第6个主题:深入理解 Hive(掌握 Hive 数据仓库的实现查询)

1. 了解基于 Hadoop 的数据平台架构
2. 了解 Hive 的应用环境
3. 了解 Hive 的作用及原理
4. 案例和演示

第7个主题:深入理解 HBase(掌握 HBase 数据仓库的原理及应用场景)

1. HBase 简介和架构
2. HBase 核心知识点
3. HBase 高级应用
4. HBase 安装、部署、启动
5. 案例和演示

第8个主题:深入理解 Zookeeper(掌握 Zookeeper的原理及应用场景)

1. Zookeeper 简介和架构
2. Zookeeper 核心知识点
3. 使用 Zookeeper 实现 Name Node 高可用

第9个主题:Spark 的架构设计(理解 Spark 平台和应用场景)

1. Spark 生态系统剖析
2. Spark 的架构设计剖析
3. RDD 计算流程解析
4. Spark 的出色容错机制
5. 案例分享