曙海教学优势
本课程,秉承二十一年积累的教学品质,以项目实现为导向,面向企事业项目实际需要,老师将会与您分享设计的全流程以及工具的综合使用经验、技巧。课程可定制,线上/线下/上门皆可,热线:4008699035。
曙海培训的课程培养了大批受企业欢迎的工程师。大批企业和曙海
建立了良好的合作关系,合作企业30万+。曙海培训的课程在业内有着响亮的知名度。
华为大数据专家(HCIE-Big Data)证定位华为大数据分析领域中大型分布式并行处理数据仓库平台的架构原理、优化设计、应用开发和大数据挖掘领域的基础理论、常用挖掘算法、应用设计以及开发、旨在推动业界大数据行业的专家型人才培养。主要内容包括华为企业级的大型并行处理分布式数据仓库平台FusionInsight LibrA的架构、功能特性、数据库设计开发;数据挖掘理论以及使用华为企业级大数据挖掘平台FusionInsight Miner和基于华为云的企业智能平台EI的基础服务- MLS机器学习服务进行数据深度分析和挖掘、通过华为HCIE-Big Data的学习、您将对大数据技术有更加深入的理解、具备运用大数据技术进行大数据分析应用、大数据挖掘应用的专家能力。
理解并掌握大型并行处理数据仓库平台的架构原理、分布式关系型数据库的设计和优化及应用开发;掌握大数据挖掘的基本原理,常用算法、常用挖掘方法、对华为大数据挖掘解决方案FusionInsight Miner和华为云机器学习服务MLS的熟练使用,胜任数据仓库开发、大数据分析、大数据数据挖掘和人工智能的相关岗位。
第一章 数据仓库平台FusionInsight LibrA
理论
第一节 分布式数据库架构
n 体系架构基本知识
n 熟悉MPP架构及优势
n 业界产品说明
第二节 FusionInsight LibrA 基本组件简介
n LibrA逻辑架构
n LibrA物理架构
n LibrA数据库对象
第三节 FusionInsight LibrA 产品特性和关键技术
n 架构和支持的操作系统
n 面向应用开发的基本功能
n 数据库安全
n 图形化工具
n 高级特性
第四节 FusionInsight LibrA 配套工具集
n Database Manager概念与架构
n Database Manager的安装
n Database Manager的使用
n Data Studio概念与架构
n Data Studio的安装与FusionInsight LibrA服务器的配置
n Data Studio工具支持的特性
n Data Studio的使用
第五节 FusionInsight LibrA 安全管理
n 访问控制
n 用户管理
n 权限管理模型
n 对象权限
n 安全审计
第六节 FusionInsight LibrA 数据库管理系统并发控制
n 配置负载均衡
n 事务与隔离
n LibrA锁机制介绍
第七节 FusionInsight LibrA 数据库性能监控
n 系统资源监控方式
n 性能相关视图
n 使用命令行监控集群性能
n 使用DM工具监控集群性能
第八节 FusionInsight LibrA 数据迁移
n 数据迁移场景划分
n GDS工具适用场景和使用方法
n copy from/to适用场景和使用方法
n 开源ELT工具适用场景和使用方法
n gs_dump/gs_restore适用场景和使用方法
n gsql工具适用场景和使用方法
n Roach工具适用场景和使用方法
n 从其他数据库中迁移数据
第九节 FusionInsight LibrA SQL介绍
n SQL相关机制和原理
n 利用EXPLAIN进行SQL调优
第十节 FusionInsight LibrA 数据库设计
n 数据库逻辑设计
n 存储模式
n 数据分布
n 表分区
n 索引
第十一节 FusionInsight LibrA 应用程序开发指导
n FusionInsight LibrA驱动介绍
n ODBC应用程序开发
n JDBC应用程序开发
n 基础开发规范
第二章 FusionInsight LibrA实验
n FusionInsight LibrA基本操作、语法
n FusionInsight LibrA性能优化
n 网络KPI数据栅格化处理
n 重点区域数据分析
n 流动人口常驻地分析
第三章 大数据挖掘理论
第一节 预备知识和数据介绍
n 数据挖掘的定义
n 数据挖掘的流程
n 数据挖掘的应用
n 数据和属性类型
n 数据的统计描述
n 数据的邻近性度量
第二节 数据预处理
n 为什么要预处理数据
n 数据清理
n 数据集成
n 数据归约
n 数据变换
第三节 数据仓库介绍
n 数据仓库的概念
n 数据仓库的体系结构与模型
n 多维数据模型
n 概念分层
n OLAP与OLTP
n 方体物化
第四节 分类
n 分类和回归的概念
n 决策树分类
n 朴素贝叶斯分类
n 组合分类
n 后向传播分类
n 支持向量机分类
n 模型评估与选择
第五节 聚类
n 聚类的定义
n K-均值算法
n k-中心点算法
第六节 离群点检测
n 离群点的概念
n 离群点检测的方法
第七节 关联规则(Association Rule)
n 关联规则的定义
n 关联规则挖掘步骤及相关概念
n 关联规则挖掘方法分类
n Apriori算法
第八节 FusionInsight Miner 和华为云机器学习服务MLS
n FusionInsight Miner整体介绍
n 关系分析
n 标签管理
n 华为云机器学习服务
第四章 大数据挖掘实战
n 银行定期存款业务预测
n 客户分群