曙海教学优势
本课程以项目实现为导向,面向企事业项目实际需要,秉承二十一年积累的教学品质,老师将会与您分享设计的全流程以及工具的综合使用经验、技巧。线上/线下/上门皆可,课程可定制,热线:4008699035。
曙海培训的课程培养了大批受企业欢迎的工程师。曙海培训的课程在业内有着响亮的知名度。大批企业和曙海
建立了良好的合作关系,合作企业30万+。
Spark已经被不少互联网公司采用,大部分数据挖掘算法和迭代式算法在逐步MapReduce平台迁移到Spark平台中,包括阿里巴巴(广告系统),腾讯(广点通精准推荐),百度,优酷土豆,360,支付宝等互联网公司已经在线上产品中使用spark,且取得了令人满意的效果,另外,部分省份的运营商也正在尝试使用spark解决数据挖掘和分析问题,部分银行,如工商银行,也正在尝试spark平台。
本课程将为大家全面而又深入的介绍Spark平台的构建流程,涉及Spark系统基础知识,概念及架构, Spark实战技巧,Spark经典案例等。
通过本课程实践,帮助学员对Spark生态系统有一个清晰明了的认识;理解Spark系统适用的场景;掌握Spark等初中级应用开发技能;搭建稳定可靠的Spark集群,满足生产环境的标准;了解和清楚大数据应用的几个行业中的经典案例,包括阿里巴巴,腾讯,百度等互联网行业,中国移动和联通等运营商。
各类 IT/软件企业和研发机构的软件架构师、软件设计师、程序员。对于怀有设计疑问和问题,需要梳理解答的团队和个人,效果最佳。
1) 了解Java语言(Scala语言会作为课程内容进行介绍);
2) 了解Linux系统;
主题 | 内容 |
Spark大数据架构概述及案例简介 |
1. 1介绍Spark大数据层级架构及各层软件设计要求,包括数据收集,大数据存储,大数据计算框架,大数据应用等 |
Spark产生动机与基本概念 |
2.1 Spark产生背景,与MapReduce对比,其优缺点是什么 |
Spark安装部署 |
3.1 Spark运行模式简介、standlone模式、Spark on yarn模式 |
Spark程序设计实例 |
4.1 Scala语言基础,常用语法以及库函数 |
Spark内部原理 |
5.1 Spark程序运行流程概述 |
Spark与外部系统整合 |
6.1 Spark与Kafka和flume结合 |
Spark调优方法 |
Spark调优思想、方法 |
Spark案例分析 |
基于Spark的商品推荐系统,包括:项目背景、项目架构、项目实施 |
Spark Streaming应用及案例分析 |
8.1 Spark Streaming产生动机 |
Spark SQL |
9.1 Spark SQL定位 |
MLlib |
10. 介绍Spark的数据挖掘库MLlib,重点介绍其内部的几个分类算法,聚类算法和推荐算法,包括逻辑回归,K-Means,协同过滤等 |
GraphX |
11. 介绍Spark内部的图计算框架GraphX,重点介绍它的基本原理及使用方法 |