oracle取左表不在右表记录的3种方法引申到db2开发系列(五)

来源:88必发收集  发布日期:2015-08-03 22:52:07

引:

我们在做数据库开发用 pl sql 加工数据时,经常会遇到取a表不在b表中的记录 或者 左表不在右表中的记录 的情况,所以特地对此做个简单的总结,以便以后用到回顾。

解决:

取a表某字段不在b表 我们自然的逻辑会想到用 a not in b ,这是第一种方法

1 not in


如下图 ,数据库为不跑业务的测试数据库,两张表的数据量一样, 用not in 可以找出a表中prd_inst_id不在t表中的记录

如下图,为生产库的表 l 和t表数据量相同,数据量900w左右

2 not exsits

1) 如下图,用的 not exists 找出 a表prd_inst_id 不在b表的记录

2)

 

select ssss1.*
  from odso.tb_b_ft_broadband_l ssss1
 where not exists (select 1
          from tb_b_ft_broadband b
         where ssss1.prd_inst_id = b.prd_inst_id); --2min 30s


 

3 left join or right join 特别注意 一般不会想到这个

如下图:先用a表 左关联b表 取到a表所有记录的结果集 ,再限制 b.latn_id is null (假设b 本身记录latn_id没有是空的) 实际上应该用b.prd_inst_id is null (关联字段)

即可得到 b表中没有a表prd_inst_id的那些记录,即a表不在b表的记录

上面的所有情况都是a表不在b表的记录占 总记录数据是很少的情况,几百万分之一

从效率上看,测试库的 not in 比 not exsits 在20w及的数据量下 快,差距虽然2倍,但是时间相差不大。

生产库的not exists 比 not in快很多 两分钟,所以关于 not in 及not exists 哪个更快的问题 要看具体情况及执行计划,参考:

oracle开发系列(三)exists¬ exists用法及与in¬ in比较(10g)

再看left join 时间花了 10分钟,比 not in 及exists 满了 好几倍,

但是在db2里面 一般 找数据量大的不存在于 一般都用left join 关联字段为分布键,会很快。

备注:

第3种 left join ,有时候面试的时候或许会问到。 防止紧张 想不起来



 

Tag标签: 方法   左表  
  • 专题推荐

About 88必发 - 广告服务 - 隐私声明 - 版权申明 - 免责条款 - 网站地图 - 网友投稿 - 联系方式
本站内容来自于互联网,仅供用于网络技术学习,学习中请遵循相关法律法规