1. 怎么样才算是真正意义的大数据平台
2. 开源Hadoop介绍
3. 数据采集过程与分布式存储
4. 数据仓库与数据分析
5. 集群监控与调度组件
6. 移动互联网行为分析
7. 网上舆情分析
1. 我们应该选哪种Hadoop?
2. 集群硬件应该如何选配?
3. 部署案例讲解
1. 如何实现日志的准实时收集、处理?
2. Flume
3. Storm流式处理 + 消息集群
4. 流式处理与Hadoop集群结合
第四部分:Hbase列数据库及应用案例
1. Hbase感性认识
1) 在大数据的实际应用中关系型数据库,NoSQL数据库和hdfs分布式文件系统三种存储方式关系和如何集成应用;
2) Hbase来源?
3) Hbase记录长什么样?
4) Hbase存储文件是什么样的?
5) Hbase表的逻辑结构
6) Hbase常见概念
2. Hbase主要组成
7) Zookeeper、Hmaster
8) HRegionServer、Region
9) HStore存储、Hfile
10) Hbase内部扫描RowKey的原理
11) Hbase内部读写原理
12) HBase设计原理、架构分析
13) Hadoop+HBase伸缩性(自动扩容、热部署)
14) HBase相关表结构设计(列族、列详细分析)
15) HBase主HMaster与备用HMaster间的切换原理
16) HBase基本命令介绍
3. 如何使用Hbase?
17) Hbase的6种使用方式
18) HBase Shell方式访问;
19) HBase Java API方式访问;
20) Hive+Hbase方式访问;
21) Pig+Hbase方式访问;
4. Hbase+Zookeeper使用配置
22) Zookeeper简介
23) Zookeeper与 HBase 的关系
5. 项目案例:
24) 哪些场景适用Hbase ?
第五部分:大数据挖掘介绍与应用案例
1. 大数据挖掘和传统数据挖掘区别?
1) 传统数据挖掘
2) SPSS Modeler 14.2
3) SAS简介
3) Mahout简介
4) Rhadoop例子
2. 算法介绍和应用
1) 关联分析
2) K-means
3) 决策数据C5.0
4) 逻辑线性Logistic回归
5) 主成分/因子分析
6) Apriori算法
7) 预测算法
8) 神经网络
3. 项目案例详解
1) 用户行为编好分析
2) 客户流失预测分析
3) 顾客位置信息
4. 大数据可视化
1) 现状和问题
2) HeatMap热力图
3) Treemapping矩形式树状图
4) 百度Echarts例子介绍
5) 海云数据
6) 淘宝指数