tez基础入门

概览

Apache Tez是构建于Apache Hadoop YARN上,基于有向无环图进行数据处理的框架。

主要设计主题:

  • 授权终端用户

    • 表达性数据流定义API

    • 灵活的输入处理输出运行模型

    • 数据类型无关

    • 极易部署

  • 执行性能

    • 优于mapreduce

    • 优化资源管理

    • 运行时计划重新配置

    • 动态物理数据流决策

通过允许像Apache Hive和Apache Pig这样的项目运行复杂的DAG任务,Tez可以用来处理数据,以前需要多个MR任务,现在只需要一个Tez任务,如下所示。

tez基础入门

0 0 投票数
文章评分

本文为从大数据到人工智能博主「xiaozhch5」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://lrting.top/backend/2075/

(0)
上一篇 2021-11-12 21:51
下一篇 2021-11-12 22:01

相关推荐

订阅评论
提醒
guest
0 评论
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x
()
x