1、Hive体系结构介绍,数据仓库基础知识,Hive在实际中的应用情况、安装、配置、命令,Hive集群
2、Hive和传统关系数据库的比较,HiveQL、Hive的数据类型,Hive函数以及分区,Hive的存贮格式
3、Hive表的修改、废弃以及查询中的排序和聚集函数应用,数据导入
4、Hive中的连接,MapReduce脚本,Hive中视图的应用、自定义函数,Hive总结及开发实例
5、HBase数据模型及系统架构分析,HBase上的MapReduce,HBase编辑视图
6、HBase的物理存储(Htable、HRegion、Store、Hfile、Hlog),Hbase的系统架构,HBase流程及算法,HBase源码解读以及HBase优化,Spark/Spark SQL/Spark Scala架构介绍及集群搭建
7、数据分析及抽取工具Sqoop,数据挖掘常用算法分析(回归分析、分类、聚类等)、Mahout分析
8、项目实战:电信业日志分析系统、用户行为分析系统(基站日志分析、能力指标分析、用户行为分析、精准营销系统实现)