對於重複行刪除的問題,網上很難找到合適的答案,問問題的不少,但在搜尋引擎中草草地看了一下前面的記錄都沒有解決方案。
其實這個問題可以很華麗的解決。
1、如果這張表沒有主鍵(或者相同的行並沒有不相同的內容列),則需要建立一個自增列,用來區分不同列。例如
複製代碼 代碼如下:alter table [tablename] add [TID] int IDENTITY(1,1)
就是增加一個自增量的臨時列TID。
為啥要用SQL語句?如果超過幾十萬行的話用SQL SERVER企業管理器的設計介面修改通常會逾時。
2、然後就是關鍵了。給個例子就是我手上正要處理的IP地址所在地清單。近40萬條資料,有SIP和EIP(開始IP和結束IP)記錄重複,重複條數大概佔1/5左右。對此情況用簡單的一條SQL命令就搞定: 複製代碼 代碼如下:delete from query_IP where TID not in (select max(TID) from query_IP group by SIP,EIP)
就是將SIP和EIP分組,取得同樣分組的最大的TID值。然後將原表中不在其中的內容(也就是同樣分組的重複內容中更小的ID內容)刪除即可。
用這種思路可以延伸出很多SQL解題的方式。比如說某個使用者登陸表,要查看每個使用者最近的登陸記錄。
很優雅的一條查詢語句: 複製代碼 代碼如下:Select * from LoginLog where ID in (select max(ID) from LoginLog group by UserID)
SQL強大之極,許多複雜的需求往往可以合并到一條SQL語句查詢中實現。因此在我的程式中除了UPDATE/INSERT等操作需要事務支援,或是記錄量實在太大需要分頁或暫存資料表。通常都用一條SQL語句來實現。比如說select *,(select count(*) from xxx where xxx=t.ID) from t where...。這樣就可以在SELECT語句中擷取關聯的統計項,對於中小型系統尤其實用。