文章

深入浅出Hive企业级架构优化

课程简介:
深入浅出Hive企业级架构优化、Hive Sql优化、压缩和分布式缓存

作为企业Hadoop应用的核心产品,Hive承载着FaceBook、淘宝等大佬 95%以上的离线统计,很多企业里的离线统计甚至全由Hive完成,如我所在的电商。Hive在企业云计算平台发挥的作用和影响愈来愈大,如何优化提速已经显得至关重要。

Hive作业的规模决定着优化层级,一个Hive作业的优化和一万的Hive作业的优化截然不同。拥有1万多个Hive作业的大电商如何进行Hive优化的?本系列课结合企业实战和场景从作业架构层面、Hql(Hive sql)语法层面、Hive参数层面依次讲述。

当然,好的架构胜过任何优化,有哪些策略构建好Hive Job架构?好的Hql同样会效率大增,如何写出高效的Hql?修改Hive参数,有时也能起到很好的效果

课程讲师:Cloudy

课程环境:
Cloudera Hadoop 4 (Hadoop 2.0)
Hive-0.90

所需技术基础:
Hadoop基础、Hive基础、Linux基础,其他不限制(不分Java和.Net方向,皆适合)

打包下载

百度网盘:http://pan.baidu.com/s/1c0gr9XQ深入浅出Hive企业级架构优化

文件大小:111.78M

提取密码:dw7q  点击获取更多教程资源

解压密码:www.he11oworld.com

课程目录

第1节 Hive体系结构及Hive作业形式
第2节 Hive优化策略大探底及架构优化案例
第3节 架构优化案例二之降IO负载策略
第4节 Hive语法、参数层面优化
第5节 Hive语法、参数层面优化二
第6节 Hive语法、参数层面优化三
第7节 架构优化案例二之降IO负载策略III—压缩和分布式缓存

0 0

发表评论