曙海教学优势
本课程,秉承二十一年积累的教学品质,以项目实现为导向,面向企事业项目实际需要,老师将会与您分享设计的全流程以及工具的综合使用经验、技巧。课程可定制,线上/线下/上门皆可,热线:4008699035。
曙海培训的课程培养了大批受企业欢迎的工程师。大批企业和曙海
建立了良好的合作关系,合作企业30万+。曙海培训的课程在业内有着响亮的知名度。
本课程将为大家全面而又深入的介绍Spark平台的构建流程,涉及Spark系统基础知识,概念及架构, Spark实战技巧,Spark经典案例等。
通过本课程实践,帮助学员对Spark生态系统有一个清晰明了的认识;理解Spark系统适用的场景;掌握Spark等初中级应用开发技能;搭建稳定可靠的Spark集群,满足生产环境的标准;了解和清楚大数据应用的几个行业中的经典案例,包括阿里巴巴,腾讯,百度等互联网行业,中国移动和联通等运营商。
各类 IT/软件企业和研发机构的软件架构师、软件设计师、程序员。对于怀有设计疑问和问题,需要梳理解答的团队和个人,效果最佳。
1) 了解Java语言(Scala语言会作为课程内容进行介绍);
2) 了解Linux系统;
主题 | 内容 |
Spark大数据架构概述及案例简介 |
1. 1介绍Spark大数据层级架构及各层软件设计要求,包括数据收集,大数据存储,大数据计算框架,大数据应用等 |
Spark产生动机与基本概念 |
2.1 Spark产生背景,与MapReduce对比,其优缺点是什么 |
Spark安装部署 |
3.1 Spark运行模式简介、standlone模式、Spark on yarn模式 |
Spark程序设计实例 |
4.1 Scala语言基础,常用语法以及库函数 |
Spark内部原理 |
5.1 Spark程序运行流程概述 |
Spark与外部系统整合 |
6.1 Spark与Kafka和flume结合 |
Spark调优方法 |
Spark调优思想、方法 |
Spark案例分析 |
基于Spark的商品推荐系统,包括:项目背景、项目架构、项目实施 |
Spark Streaming应用及案例分析 |
8.1 Spark Streaming产生动机 |
Spark SQL |
9.1 Spark SQL定位 |
MLlib |
10. 介绍Spark的数据挖掘库MLlib,重点介绍其内部的几个分类算法,聚类算法和推荐算法,包括逻辑回归,K-Means,协同过滤等 |
GraphX |
11. 介绍Spark内部的图计算框架GraphX,重点介绍它的基本原理及使用方法 |