Etl之HiveSql调优(union all)

原创

mb6124a48b25a4a 2021-08-24 16:13:58 博主文章分类：大数据 ©著作权

文章标签 数据 hive 并行处理获取数据 html 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者mb6124a48b25a4a的原创作品，请联系作者获取转载授权，否则将追究法律责任

相信在Etl的过程中不可避免的实用union all来拼装数据，那么这就涉及到是否并行处理的问题了。

在hive中是否适用并行map，可以通过参数来设定：

set hive.exec.parallel=true;

那么还是实用上一篇博客的数据

如果咱们需要一些数据：

select * from (select sight_id from order_sight where create_time="2015-10-10" and sight_id = 9718 union all select id as sight_id from sight where id = 9718) a;

就是模拟分别从两个表里面获取数据，如果不开启并行，实用的时间是开启时间的两倍，所以这个地方多加注意！

上一篇：Linux 网络编程一步一步学（四）-设置非阻塞方式

下一篇：JAVA设计模式——第 5 章工厂方法模式【Factory Method Pattern】（转）

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯