曙海教学优势
本课程,秉承二十一年积累的教学品质,以项目实现为导向,面向企事业项目实际需要,老师将会与您分享设计的全流程以及工具的综合使用经验、技巧。课程可定制,线上/线下/上门皆可,热线:4008699035。
曙海培训的课程培养了大批受企业欢迎的工程师。大批企业和曙海
建立了良好的合作关系,合作企业30万+。曙海培训的课程在业内有着响亮的知名度。
课程大纲:
第一部分:入库速度和查询速度权衡
1.如何提高入库速度
2.如何提高查询速度
3.如何在入库速度和查询速度之间获得平衡(重要)
第二部分:如何让ES查询更方便
1.支持SQL查询
a.ElasticSearch-SQL
b.Spark-SQL
2.开发一个QueryEngine,支持管理和查询所有ES集群
第三部分:ES查询的精度问题
1.一定存在误差的场景
2.可能存在误差的场景
第四部分:如何加快ES故障恢复
1.ES recovery原理分析
2.加快Recovery的一些常见参数
第五部分:保证集群的高可用
1.合理的参数配置
2.合理的监控报警
3.双写
第六部分:集群规划
1.节点类型
2.集群内部组划分(Tag)
3.多集群
第七部分:数据归档和恢复
1.冷热分离
2.归档
3.转储(如HDFS)
4.定时清理
第八部分:ES周边
1.常见Pipline(技术组合)
a.Logstach+ES+Kibana
b.Logstach/Flume+Kafka+Storm/Spark+ES+Kibana
c.优缺点和适用场景
2.和大数据的整合ElasticSearch Hadoop介绍
3.StreamingPro介绍
4.Flume/Nginx+Kafka+SparkStreaming+ES+Kibana/Spark SQL分析
第九部分:ES和其他大数据解决方案的区别
1.Apache Kylin
2.Apache Carbondata
3.Spark SQL+Parquet
4.Apache Druid
5.Apache Impala
第十部分:ES源码导读(Optional)
1.ES内部Rest/RPC接口调用体系
2.ES如何和Lucene进行衔接
3.如何在代码中查看一些undocument的参数