欢迎来到IT培训的黄埔军校——智游教育! 加入收藏 联系我们 0371-88888598  4006-371-555

第四阶段--数据仓库、数据挖掘

于2016-03-30 18:25:26 发表在大数据知识库
  1、Hive体系结构介绍,数据仓库基础知识,Hive在实际中的应用情况、安装、配置、命令,Hive集群

  2、Hive和传统关系数据库的比较,HiveQL、Hive的数据类型,Hive函数以及分区,Hive的存贮格式
 
  3、Hive表的修改、废弃以及查询中的排序和聚集函数应用,数据导入
 
  4、Hive中的连接,MapReduce脚本,Hive中视图的应用、自定义函数,Hive总结及开发实例
 
  5、HBase数据模型及系统架构分析,HBase上的MapReduce,HBase编辑视图
 
  6、HBase的物理存储(Htable、HRegion、Store、Hfile、Hlog),Hbase的系统架构,HBase流程及算法,HBase源码解读以及HBase优化,Spark/Spark SQL/Spark Scala架构介绍及集群搭建
 
  7、数据分析及抽取工具Sqoop,数据挖掘常用算法分析(回归分析、分类、聚类等)、Mahout分析
 
  8、项目实战:电信业日志分析系统、用户行为分析系统(基站日志分析、能力指标分析、用户行为分析、精准营销系统实现)