| 大数据存储概览 
 | 
大数据的产生、引用、存储与应用大数据存储的特点大数据库的基本元素海量数据库的开发特性数据库的数据分析与挖掘应用数据仓库与数据集市 | 
| 大数数据平台Hadoop概览 | 
文件存储-HDFSHDFS-工作原理数据计算MapReduceMapReduce工作原理SQL分析-Hive海量实时读写-HBase分布式协调系统—Zookeeper数据抽取工具Sqoop使用 
Hadoop分布式文件系统MapReduce工作原理Hadoop集群剖析Hadoop生态系统对一种新的解决方案的需求Hadoop的行业应用案例分析Hadoop在云计算和大数据的位置和关系 | 
| Hadoop集群规划 | 
Hadoop 集群内存要求
                                
Namenode的机器配置Datanode的机器配置SNN的机器配置Hadoop集群磁盘分区集群和网络拓扑要求集群软件的端口配置 | 
| Hadoop简介和生态系统介绍 | 
传统大规模数据分析存在的问题Hadoop概述Hadoop与分布式文件系统Hadoop生态系统Hadoop的行业应用案例分析Hadoop在云计算和大数据的位置和关系Hadoop版本介绍Hadoop与Google FS的关系Hadoop在国内的使用情况和未来 | 
| Hadoop安装和主要配置文件介绍 | 
Hadoop安装所需软件介绍Hadoop单机安装Hadoop伪分布式安装Hadoop完全分布式安装Hadoop三个节点安装的配置介绍Hahoop多节点ssh配置Hadoop格式化详解Hadoop核心配置文件介绍核心配置文件core-site.xmlHDFS配置文件hdfs-site.xmlMapreduce配置文件mapred-site.xmlmaster文件配置详解slave文件配置详解Hadoop启动和停止方法一 
—start-all.sh详解—stop-all.sh详解 
Hadoop安装的常见错误介绍和解决方案使用自带的wordcount和pi测试集群安装是否成功使用Streaming来测试集群安装是否成功 | 
| Hadoop组件介绍 | 
Hadoop NameNode 介绍Hadoop SecondaryNameNode 介绍Hadoop DataNode 介绍Hadoop JobTracker 介绍Hadoop TaskTracker 介绍 | 
| Hadoop的HDFS模块 | 
HDFS架构介绍HDFS原理介绍NameNode功能详解DataNode功能详解SecondaryNameNode功能详解HSFD的fsimage和editslog详解HDFS的block详解HDFS的block的备份策略Hadoop的机架感知配置HDFS的shell命令介绍HDFS的thrift server服务介绍HDFS的API接口介绍HDFS的权限详解Hadoop的客服端接入案例 | 
| MapReducer入门和高级开发实战 | 
Mapreduce原理MapReduce流程剖析一个MapReduce程序Mapper和Reducer抽象类详解Mapreduce的最小驱动类MapReduce自带的类型自定义Writables和WritableComparablesMapreduce的输入InputFormatsMapReduce的输出OutputFormats自定义InputFormat自定义InputSPlits自定义RecorderReaderCombiner详解Partitioner详解DistributeFileSystem详解Hadoop Tools工具介绍Counter计数器详解自定义Counter计数器基于Hadoop二次开发实战MapReduce的优化Map和Reduce的个数设置Hadoop小文件优化任务调度默认的任务调度公平任务调度能力任务调度使用 Hadoop MapReduce Streaming 编程MapReduce的单元测试 | 
| Hive的使用和实战 | 
Hive和Pig基础Hive、Impala和presto的比较Hive的作用和原理说明Hadoop仓库和传统数据仓库的协作关系Hadoop/Hive仓库数据数据流Hive 部署和安装Hive Cli 的基本用法Hive的server启动HQL基本语法Hive的加载数据本地加载和HDFS加载Hive的partition详解Hive的存储方式详解RCFILE、TEXTFILE和SEQUEUEFILEHive的UDF和UDAFHive的transform详解Hive的JDBC连接 | 
| Hbase使用 | 
Hbase原理Hmaster详解RegionServer详解Zookeeper介绍Hbase安装Hbase逻辑视图介绍Hbase物理视图介绍Hbase的二级索引介绍Hbase 的DDL和DMLHbase表的设计案例Hbase的import功能介绍MapReduce操作HbaseHbase的 thrift Server介绍Hbase 的API介绍Hbase案例分析 | 
| Hadoop集群配置介绍和维护 | 
Hadoop集群的部署要点NameNode和SecondaryNameNode和JobTracker机器的配置要求dataNode与tasktracker机器的配置要求Hadoop集群管理的工具介绍Ganglia和nigos监控Hadoop集群介绍Ambri介绍添加和删除节点演示Namenode的单点解决方案NameNode的NFS备份介绍集群所有dataNode挂掉的故障介绍集群NameNode的fsimage丢掉恢复方法Hadoop集群维护的注意点 | 
| 数据抽取工具Sqoop使用 | 
Sqoop是什么Sqoop安装Sqoop把mysql数据导入HDFSSqoop把HDFS数据导入MysqlSqoop吧Mysql数据导入HiveSqoop吧Mysql数据导入Hive分区执行脚本的解析数据导入过程中的典型问题和解决办法  |