重複資料刪除技術可以提供更大的備份容量,實現更長時間的資料保留,還能實現備份資料的持續驗證,提高資料恢複服務水平,方便實現資料容災等。 重複的資料可能有這樣兩種情況,第一種時表中只有某些欄位一樣,第二種是兩行記錄完全一樣。Oracle資料庫重複資料刪除技術有如下優勢:更大的備份容量、資料能得到持續驗證、有更高的資料恢複服務水平、方便實現備份資料的容災。
一、刪除部分欄位重複資料
先來談談如何查詢重複的資料吧。
下面語句可以查詢出那些資料是重複的:
select 欄位1,欄位2,count(*) from 表名 group by 欄位1,欄位2 having count(*) > 1
將上面的>號改為=號就可以查詢出沒有重複的資料了。
想要刪除這些重複的資料,可以使用下面語句進行刪除:
delete from 表名 a where 欄位1,欄位2 in
(select 欄位1,欄位2,count(*) from 表名 group by 欄位1,欄位2 having count(*) > 1)
上面的語句非常簡單,就是將查詢到的資料刪除掉。不過這種刪除執行的效率非常低,對於大資料量來說,可能會將資料庫弔死。所以我建議先將查詢到的重複的資料插入到一個暫存資料表中,然後對進行刪除,這樣,執行刪除的時候就不用再進行一次查詢了。如下:
CREATE TABLE 暫存資料表 AS
(select 欄位1,欄位2,count(*) from 表名 group by 欄位1,欄位2 having count(*) > 1)
上面這句話就是建立了暫存資料表,並將查詢到的資料插入其中。
下面就可以進行這樣的刪除操作了:
delete from 表名 a where 欄位1,欄位2 in (select 欄位1,欄位2 from 暫存資料表);
這種先建暫存資料表再進行刪除的操作要比直接用一條語句進行刪除要高效得多。
這個時候,大家可能會跳出來說,什嗎?你叫我們執行這種語句,那不是把所有重複的全都刪除嗎?而我們想保留重複資料中最新的一條記錄啊!大家不要急,下面我就講一下如何進行這種操作。
在Oracle中,有個隱藏了自動ROWID,裡面給每條記錄一個唯一的ROWID,我們如果想保留最新的一條記錄,我們就可以利用這個欄位,保留重複資料中ROWID最大的一條記錄就可以了。
下面是查詢重複資料的一個例子:
select a.rowid,a.* from 表名 a
where a.rowid !=
(
select max(b.rowid) from 表名 b
where a.欄位1 = b.欄位1 and
a.欄位2 = b.欄位2
)
下面我就來講解一下,上面括弧中的語句是查詢出重複資料中ROWID最大的一條記錄。
而外面就是查詢出除了ROWID最大之外的其他重複的資料了。
由此,我們要重複資料刪除資料,只保留最新的一條資料,就可以這樣寫了:
delete from 表名 a
where a.rowid !=
(
select max(b.rowid) from 表名 b
where a.欄位1 = b.欄位1 and
a.欄位2 = b.欄位2
)
查看本欄目更多精彩內容:http://www.bianceng.cnhttp://www.bianceng.cn/database/Oracle/