您好,欢迎来到华佗健康网。
搜索
您的当前位置:首页spark-宽依赖和窄依赖

spark-宽依赖和窄依赖

来源:华佗健康网
spark-宽依赖和窄依赖

⼀、窄依赖(Narrow Dependency,)

即⼀个RDD,对它的⽗RDD,只有简单的⼀对⼀的依赖关系。也就是说, RDD的每个partition ,仅仅依赖于⽗RDD中的⼀个partition,⽗ RDD和⼦RDD的partition之间的对应关系,是⼀对⼀的!这种情况下,是简单的RDD之间的依赖关系,也被称之为窄依赖。

⼆、宽依赖(Shuffle Dependency)

本质就是Shuffle,也就是说,每⼀个⽗RDD的partition中的数据,都可能会传输⼀部分到下⼀个RDD的每个partition中。此时就会出现,⽗RDD和⼦RDD的partition之间,具有交互综复杂的关系。那么,这种情况,就叫做两个RDD之间是宽依赖。同时,他们之间发⽣的,操作,是Shuffle,

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo0.com 版权所有 湘ICP备2023021991号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务