概览
Apache Tez是构建于Apache Hadoop YARN上,基于有向无环图进行数据处理的框架。
主要设计主题:
-
授权终端用户
-
表达性数据流定义API
-
灵活的输入处理输出运行模型
-
数据类型无关
-
极易部署
-
-
执行性能
-
优于mapreduce
-
优化资源管理
-
运行时计划重新配置
-
动态物理数据流决策
-
通过允许像Apache Hive和Apache Pig这样的项目运行复杂的DAG任务,Tez可以用来处理数据,以前需要多个MR任务,现在只需要一个Tez任务,如下所示。
本文为从大数据到人工智能博主「xiaozhch5」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://lrting.top/backend/2075/