oracle 重複資料刪除資料

來源:互聯網
上載者:User

重複的資料可能有這樣兩種情況,第一種: 表中只有某些欄位一樣,第二種是兩行記錄完全一樣。
一、對於部分欄位重複資料的刪除
1.查詢重複的資料  
select 欄位1,欄位2, count(*) from 表名 group by 欄位1,欄位2 having count(*) > 1   
例:Select owner from dba_tables group by owner having count(*)>1;
Select owner from dba_tables group by owner having count(*)=1; //查詢出沒有重複的資料  
2.重複資料刪除的資料
delete from 表名 a where 欄位1,欄位2 in (select 欄位1,欄位2,count(*) from 表名 group by 欄位1,欄位2 having count(*) > 1)
這種刪除執行的效率非常低,對於大資料量來說,可能會將資料庫弔死。
另一種高效率的方法是先將查詢到的重複的資料插入到一個暫存資料表中,然後再進行刪除。
CREATE TABLE 暫存資料表 AS
(
select 欄位1,欄位2, count(*) as row_num
from 表名
group by 欄位1,欄位2
having count(*) > 1
);
  上面這句話就是建立了暫存資料表,並將查詢到的資料插入其中。
  下面就可以進行這樣的刪除操作了:
delete from 表名 a
where 欄位1,欄位2 in (select 欄位1,欄位2 from 暫存資料表);   
3.保留重複資料中最新的一條記錄
在Oracle中,rowid是隱藏欄位,用來唯一標識每條記錄。所以,只要保留重複資料中rowid最大的一條記錄就可以了。  
查詢重複資料:
select a.rowid,a.* from 表名 a
where a.rowid != (
select max(b.rowid) from 表名 b
where a.欄位1 = b.欄位1 and a.欄位2 = b.欄位2 );   
例:selete from dba_tables a
where a.rowid!=(
select max(rowid) from test b
where a.owner=b.owner);
  重複資料刪除資料,只保留最新的一條資料:
delete from 表名 a
where a.rowid != (
select max(b.rowid) from 表名 b
where a.欄位1 = b.欄位1 and a.欄位2 = b.欄位2 )
  使用暫存資料表實現高效查詢
create table 暫存資料表 as
(select a.欄位1, a.欄位2, MAX(a.ROWID) as dataid from 正式表 a
GROUP BY a.欄位1,a.欄位2);
delete from 表名 a
where a.rowid !=
( select b.dataid from 暫存資料表 b
where a.欄位1 = b.欄位1 and
a.欄位2 = b.欄位2 );
commit;
  二、對於完全重複記錄的刪除
  對於表中兩行記錄完全一樣的情況,可以用下面語句擷取到去掉重複資料後的記錄:
select distinct * from 表名
可以將查詢的記錄放到暫存資料表中,然後再將原來的表記錄刪除,最後將暫存資料表的資料導回原來的表中。如下:
CREATE TABLE 暫存資料表 AS (select distinct * from 表名);
drop table 正式表;
insert into 正式表 (select * from 暫存資料表);
drop table 暫存資料表;   假如想刪除一個表的重複資料,可以先建一個暫存資料表,將去掉重複資料後的資料匯入到暫存資料表,然後在從暫存資料表將資料匯入正式表中,如下: INSERT INTO t_table_bak
select distinct * from t_table;
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.