1. 怎么样才算是真正意义的大数据平台
2.      开源Hadoop介绍
3. 数据采集过程与分布式存储
4. 数据仓库与数据分析
5. 集群监控与调度组件
6.      移动互联网行为分析
7.      网上舆情分析
1. 我们应该选哪种Hadoop?
2. 集群硬件应该如何选配?
3. 部署案例讲解
1. 如何实现日志的准实时收集、处理?
2. Flume
3. Storm流式处理 + 消息集群
4. 流式处理与Hadoop集群结合
第四部分:Hbase列数据库及应用案例
1. Hbase感性认识
 1) 在大数据的实际应用中关系型数据库,NoSQL数据库和hdfs分布式文件系统三种存储方式关系和如何集成应用;
 2) Hbase来源?
 3) Hbase记录长什么样?
 4) Hbase存储文件是什么样的?
 5) Hbase表的逻辑结构
 6) Hbase常见概念
2. Hbase主要组成
 7) Zookeeper、Hmaster
 8) HRegionServer、Region
 9) HStore存储、Hfile
 10) Hbase内部扫描RowKey的原理
 11) Hbase内部读写原理
 12) HBase设计原理、架构分析
 13) Hadoop+HBase伸缩性(自动扩容、热部署)
 14) HBase相关表结构设计(列族、列详细分析)
 15) HBase主HMaster与备用HMaster间的切换原理
 16) HBase基本命令介绍
3. 如何使用Hbase?
 17) Hbase的6种使用方式
 18) HBase Shell方式访问;
 19) HBase Java API方式访问;
 20) Hive+Hbase方式访问;
 21) Pig+Hbase方式访问;
4. Hbase+Zookeeper使用配置
 22) Zookeeper简介
 23) Zookeeper与 HBase 的关系
5. 项目案例:
 24) 哪些场景适用Hbase ?
第五部分:大数据挖掘介绍与应用案例
1. 大数据挖掘和传统数据挖掘区别?
 1) 传统数据挖掘
 2) SPSS Modeler 14.2
 3)    SAS简介
 3) Mahout简介
 4) Rhadoop例子
2. 算法介绍和应用
 1) 关联分析
 2) K-means
 3)     决策数据C5.0
 4)    逻辑线性Logistic回归
 5)    主成分/因子分析
 6)    Apriori算法
 7)     预测算法
 8)    神经网络
3. 项目案例详解
 1) 用户行为编好分析
 2) 客户流失预测分析
 3)    顾客位置信息
4.      大数据可视化
 1)    现状和问题
 2)    HeatMap热力图
 3)    Treemapping矩形式树状图
 4)    百度Echarts例子介绍
 5)    海云数据
 6)    淘宝指数