oracle中如何重複資料刪除資料

來源:互聯網
上載者:User

        我們可能會出現這種情況,某個表原來設計不周全,導致表裡面的資料資料重複,那麼,如何對重複的資料進行刪除呢?
        重複的資料可能有這樣兩種情況,第一種時表中只有某些欄位一樣,第二種是兩行記錄完全一樣。
一、對於部分欄位重複資料的刪除
        先來談談如何查詢重複的資料吧。
        下面語句可以查詢出那些資料是重複的:
  select 欄位1,欄位2,count(*) from 表名 group by 欄位1,欄位2 having count(*) > 1
        將上面的>號改為=號就可以查詢出沒有重複的資料了。
        想要刪除這些重複的資料,可以使用下面語句進行刪除
  delete from 表名 a where 欄位1,欄位2 in
    (select 欄位1,欄位2,count(*) from 表名 group by 欄位1,欄位2 having count(*) > 1)
        上面的語句非常簡單,就是將查詢到的資料刪除掉。不過這種刪除執行的效率非常低,對於大資料量來說,可能會將資料庫弔死。所以我建議先將查詢到的重複的資料插入到一個暫存資料表中,然後對進行刪除,這樣,執行刪除的時候就不用再進行一次查詢了。如下:
  CREATE TABLE 暫存資料表 AS
  (select 欄位1,欄位2,count(*) from 表名 group by 欄位1,欄位2 having count(*) > 1)
        上面這句話就是建立了暫存資料表,並將查詢到的資料插入其中。
        下面就可以進行這樣的刪除操作了:
  delete from 表名 a where 欄位1,欄位2 in (select 欄位1,欄位2 from 暫存資料表);
        這種先建暫存資料表再進行刪除的操作要比直接用一條語句進行刪除要高效得多。
 
       這個時候,大家可能會跳出來說,什嗎?你叫我們執行這種語句,那不是把所有重複的全都刪除嗎?而我們想保留重複資料中最新的一條記錄啊!大家不要急,下面我就講一下如何進行這種操作。
       在oracle中,有個隱藏了自動rowid,裡面給每條記錄一個唯一的rowid,我們如果想保留最新的一條記錄,
我們就可以利用這個欄位,保留重複資料中rowid最大的一條記錄就可以了。
       下面是查詢重複資料的一個例子:
  select a.rowid,a.* from 表名 a
 where a.rowid !=
 (
  select max(b.rowid) from 表名 b
  where a.欄位1 = b.欄位1 and
  a.欄位2 = b.欄位2
 )
       下面我就來講解一下,上面括弧中的語句是查詢出重複資料中rowid最大的一條記錄。
       而外面就是查詢出除了rowid最大之外的其他重複的資料了。
       由此,我們要重複資料刪除資料,只保留最新的一條資料,就可以這樣寫了:
 delete from 表名 a
 where a.rowid !=
 (
  select max(b.rowid) from 表名 b
  where a.欄位1 = b.欄位1 and
  a.欄位2 = b.欄位2
 )
 
       隨便說一下,上面語句的執行效率是很低的,可以考慮建立暫存資料表,講需要判斷重複的欄位、rowid插入暫存資料表中,然後刪除的時候在進行比較。
  create table 暫存資料表 as
    select a.欄位1,a.欄位2,MAX(a.ROWID) dataid from 正式表 a GROUP BY a.欄位1,a.欄位2;
  delete from 表名 a
 where a.rowid !=
 (
  select b.dataid from 暫存資料表 b
  where a.欄位1 = b.欄位1 and
  a.欄位2 = b.欄位2
 );
 commit;
 
二、對於完全重複記錄的刪除
 
        對於表中兩行記錄完全一樣的情況,可以用下面語句擷取到去掉重複資料後的記錄:
  select distinct * from 表名
  可以將查詢的記錄放到暫存資料表中,然後再將原來的表記錄刪除,最後將暫存資料表的資料導回原來的表中。如下:
  CREATE TABLE 暫存資料表 AS (select distinct * from 表名);
  truncate table 正式表;            --註:原先由於筆誤寫成了drop table 正式表;,現在已經改正過來
  insert into 正式表 (select * from 暫存資料表);
  drop table 暫存資料表;

      如果想刪除一個表的重複資料,可以先建一個暫存資料表,將去掉重複資料後的資料匯入到暫存資料表,然後在從
暫存資料表將資料匯入正式表中,如下:
INSERT INTO t_table_bak
select distinct * from t_table;

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.