曙海教学优势
本课程以项目实现为导向,面向企事业项目实际需要,秉承二十一年积累的教学品质,老师将会与您分享设计的全流程以及工具的综合使用经验、技巧。线上/线下/上门皆可,课程可定制,热线:4008699035。
曙海培训的课程培养了大批受企业欢迎的工程师。曙海培训的课程在业内有着响亮的知名度。大批企业和曙海
建立了良好的合作关系,合作企业30万+。
大数据处理与优化最佳实践培训
课程安排
|
主题 |
内容见要 |
第一部分 |
海量数据处理系统 |
这个部分主要讲解海量数据处理的架构设计,针对海量数据的问题设计海量数据的架构解决方案。 Ø 海量数据处理的系统场景 Ø 大数据时代的数据架构解决方案 Ø 海量数据处理的架构汇总 Ø 8种海量数据处理的架构设计比较 Ø 分布式系统架构的海量数据处理设计 Ø 海量数据处理设计 典型案例分析: |
NoSQL的实践应用 |
n High performance并发要求 n Huge Storage的存取 n High Scalability的服务器分布要求 n High Availability的服务器健壮要求
n K-V模型的Column设计 n Document模型的B Tree设计 n Object模型的基于Object数据访问设计
n Apache Hbase架构解析 n Facebook Cassandra架构解析 n Google BigTable架构解析 典型案例分析: |
|
进入Hadoop的精彩世界 |
|
|
第二部分 |
Hadoop部署与编程 |
|
Hive架构及实践案例沙盘演练 |
n gzip n bz2 n lzo n rcfile
n MapJoin n 数据倾斜 n Join顺序 n UDF编写注意事项 n 快速获取结果TopN
|
|
第三部分 |
Hadoop集群架构搭建及实践案例沙盘演练 |
|
MapReduce架构及实践案例沙盘演练 |
n MapReduce的原理和运行过程 n 构建MapReduce的开发环境
n 使用MapReduce的Java接口实现经典的WordCount n wordcount运行过程解析 n MapReduce实现数据去重操作 n MapReduce实现数据排序 n MapReduce实现数据平均数据的计算
|
|
HBase架构及实践案例沙盘演练 |
n Features:Scalability实现 n HBaseFeatures:Column-Oriented实现 n High Performance Random R/W实现 n HBase Features: Scan Search实现 n HBase Features: High�\Availability实现 典型案例分析: |