写好Hive程序的五个提示,淘宝数据平台团队
本文档由 若莲 分享于2011-07-31 08:48
使用Hive可以高效而又快速地编写复杂的MapReduce查询逻辑。但是某些情况下,因为不熟悉数据特性,或没有遵循Hive的优化约定,Hive计算任务会变得非常低效,甚至无法得到结果。一个 好 的Hive程序仍然需要对Hive运行机制有深入的了解。有一些大家比较熟悉的优化约定包括:Join中需要将大表写在靠右的位置;尽量使用UDF而不是transfrom…诸如此类。下面讨论5个性能和逻辑相关的问题,帮助你写出更好的Hive程序。全排序Hive..
分享:
君,已阅读到文档的结尾了呢~~