曙海教学优势
本课程面向企事业项目实际需要,秉承二十一年积累的教学品质,大数据架构与数据挖掘培训课程以项目实现为导向,老师将会与您分享设计的全流程以及工具的综合使用技巧、经验。线上/线下/上门皆可,大数据架构与数据挖掘培训课程专家,课程可定制,热线:4008699035。
大批企业和曙海
建立了良好的合作关系,合作企业30万+。曙海的课程培养了大批受企业欢迎的工程师。曙海的课程在业内有着响亮的知名度。
本课程将为大家全面而又深入的介绍Hadoop和Spark平台的构建流程,涉及Hadoop和Spark系统基础知识,概念及架构, Hadoop和Spark实战技巧(数据挖掘和机器学习),Hadoop和Spark经典案例等。
通过本课程实践,帮助学员对Hadoop生态系统有一个清晰明了的认识;理解Hadoop系统适用的场景;掌握Hadoop等初 中级应用开发技能;搭建稳定可靠的Hadoop集群,满足生产环境的标准;掌握如何应用hadoop和spark完成数据挖掘和机器学习任务;了解和清楚大数据应用的几个行业中的经典案例。
各类 IT/软件企业和研发机构的软件架构师、软件设计师、程序员。对于怀有设计疑问和问题,需要梳理解答的团队和个人,效果最佳。
学员学习本课程应具备下列基础知识: 1) 了解Java语言; 2) 了解Linux系统;
3) 数据挖掘基础
主题 | 内容 |
大数据架构概述 |
1. 大数据层级结构 |
数据收集系统Flume与Sqoop |
介绍如何使用flume和sqoop两个系统将外部流式数据(比如网站日志,用户行为数据等)、关系型数据库(比如MySQL、Oracle等)中的数据导入Hadoop中进行分析和挖掘 |
大数据存储系统HDFS与HBase |
1. 1. HDFS 2.0 原理、特性与基本架构 |
分布式计算技术MapReduce与Hive |
1. 介绍计算框架MapReduce基本原理,架构及程序设计方式 |
分布式计算技术Spark |
1. 介绍计算框架Spark基本原理,架构及程序设计方式 |
数据挖掘与机器学习 |
1. 常见的数据挖掘与机器学习算法 |
应用案例1:基于Hadoop的构建数据仓库 |
1. 数据仓库基础介绍 |
应用案例2:用户画像系统 |
1. 什么是用户画像系统 |
应用案例3:商品推荐系统 |
1. 什么是商品推荐系统 |
应用案例4:数据挖掘系统 |
1. 什么是数据挖掘系统 |