曙海教学优势
本课程以项目实现为导向,面向企事业项目实际需要,秉承二十一年积累的教学品质,老师将会与您分享设计的全流程以及工具的综合使用经验、技巧。线上/线下/上门皆可,课程可定制,热线:4008699035。
曙海培训的课程培养了大批受企业欢迎的工程师。曙海培训的课程在业内有着响亮的知名度。大批企业和曙海
建立了良好的合作关系,合作企业30万+。
MapReduce2.0源码分析与编程实战培训
课程大纲:
第1章 大象也会跳舞
1.1 大数据时代
1.2 大数据分析时代
1.3 简单、粗暴、有效这就是Hadoop
1.4 MapReduce与Hadoop
1.5 看,大象也会跳舞
第2章 大象的肚子HDFS文件系统详解
2.1 HDFS基础详解
2.2 HDFS数据存取流程分析
2.3 HDFS命令行操作详解
2.4 通过Web浏览HDFS文件
2.5 HDFS接口使用详解
2.6 HDFS文件同步与并发访问
第3章 “吃下去吐出来”Hadoop文件I/O系统详解
3.1 Hadoop的压缩类型介绍
3.2 Hadoop的压缩类库
3.3 I/O中序列化类型详解
3.4 实现自定义的Writable类型
3.5 Hadoop中小文件处理详解
第4章 “大象的大脑”MapReduce框架结构与源码分析
4.1 MapReduce框架结构与源码分析
4.2 编程实战:经典的MapReduce单词计数程序
第5章 深入!MapReduce配置与测试
5.1 MapReduce环境变量配置详解
5.2 使用MRUnit对MapReduce进行测试
5.3 在本地磁盘上进行MapReduce测试
5.4 MapReduce计数器
第6章 大象的思考流程MapReduce运行流程详解
6.1 经典MapReduce任务的工作流程
6.2 经典MapReduce任务异常处理详解
6.3 经典MapReduce任务的数据处理过程
6.4 MapReduce 2.0(YARN)工作流程详解
第7章 更强的大象MapReduce高级程序设计续
7.1 MapReduce程序设计默认格式类型详解
7.2 InputFormat输入格式详解
7.3 OutputFormat输出格式详解
7.4 多种输入与输出使用介绍
第8章 MapReduce相关特性详解
8.1 MapReduce计数器
8.2 排序与查找
8.3 对输出结果的值分组排序
8.4 编程实战:使用二次排序自动查找最小值
第9章 啤酒与尿布MapReduce连接与数据挖掘初步
9.1 对于同样格式数据进行MapReduce连接
9.2 对于不同格式数据进行MapReduce连接
9.3 不能说的秘密啤酒与尿布
9.4 数据挖掘初步
第10章 MapReduce实战编程及深度分析
10.1 编程实战:自定义数据库中读取数据
10.2 编程实战:串联寻找共同转载微博
10.3 编程实战:云存储模型
10.4 编程实战:多文档相似关键字检索
10.5 编程实战:学生成绩整理与分组