曙海教学优势
本课程,秉承二十一年积累的教学品质,以项目实现为导向,面向企事业项目实际需要,老师将会与您分享设计的全流程以及工具的综合使用经验、技巧。课程可定制,线上/线下/上门皆可,热线:4008699035。
曙海培训的课程培养了大批受企业欢迎的工程师。大批企业和曙海
建立了良好的合作关系,合作企业30万+。曙海培训的课程在业内有着响亮的知名度。
大数据分析- 基于Hadoop/Mahout的大数据挖掘培训课程
培训内容:
第一讲大数据挖掘及其背景
1)数据挖掘定义
2)Hadoop相关技术
3)大数据挖掘知识点
第二讲MapReduce计算模式
1)分布式文件系统
2)MapReduce
3)使用MR的算法设计
第三讲Hadoop中的云挖掘工具Mahout
1)Mahout介绍
2)推荐系统
3)信息聚类
4)分类技术
5)其它挖掘
第四讲推荐系统及其应用开发
1)一个推荐系统的模型
2)基于内容的推荐
3)协同过滤
4)电影推荐案例
第五讲分类技术及其应用
1)分类的定义
2)分类主要算法
3)Mahout分类过程
4)评估指标以及评测
5)贝叶斯算法新闻分类实例
第六讲聚类技术及其应用
1)聚类的定义
2)聚类的主要算法
3)K-Means、Canopy及其应用示例
4)FuzzyK-Means、Dirichlet及其应用示例
5)路透新闻聚类实例
第七讲关联规则和相似项发现
1)购物篮模型
2)Apriori算法
3)抄袭文档发现
4)近邻搜索的应用
第八讲流数据挖掘相关技术
1)流数据挖掘及分析
2)流数据模型
3)数据抽样
4)流过滤
第九讲大数据挖掘应用前景
1)与Hadoop集群应用的协作
2)与RHadoop等其它云挖掘工具配合
3)大数据挖掘行业应用展望