画了12张图,只为了琢磨SQL设计思想,这次真懂了
2021年1月11日 - 网易
全外连接(FullOuterJoin)等价于左外连接加上右外连接,同时返回左表和右表中所有的数据;对于两个表中不满足连接条件的数据返回空值。全外连接的原理如下图所示:交叉连接也称为笛卡尔积(CartesianProduct)。两个表的交叉连接相当于一个表的所有行和另一个表的所有行两两组合,结果的数量为两个表的行数相乘。
详情
数据质量漫谈|key|数据量_网易订阅
2021年12月27日 - 网易
1)笛卡尔积导致数据膨胀此问题往往发生在没有对join条件进行唯一性检查的情况下。因为右边数据不唯一,发生笛卡尔积,导致数据膨胀。如果是某些超大表,除了数据结果不对之外,会产生计算和存储的浪费。还有一种情况,在单一分区中数据是唯一的,但join时没有写分区条件,导致多个分区同时计算,出现数据爆炸。这个问题很多...
详情