DataTable.Select方法的效能問題

來源:互聯網
上載者:User
我們首先看一個例子:
bool a,b,c,d; a=true;b=false;c=false;d=false;
如果我們執行if(a or b or c or d){},我們發現當程式執行到a,發現為true就執行下面的語句了,就沒必要去判斷b,c,d的值了。

最近在做一些大資料量的多次比較問題,由於多次比較一些記錄塊,所以將這些記錄放到了DataTable中提高尋找的效能,使用DataTable.Select(string filterExpression)來尋找相關的記錄。但是我發現執行的比較慢。然後我把Select方法接受的xpath拆分為幾個條件執行,將其中最可能縮小範圍的條件傳遞給filterExpression,然後在找到的集合中過濾其他的條件。發現這樣比原來的執行時間少了很多。由此我估計Select演算法是運算所有的條件,然後才返回這個記錄的。
事不宜遲,我用Reflector.exe查看演算法原始碼,發現該方法是把這個filterExpression運算式分割成多個運算式,然後遍曆記錄,計算這些子條件,取到滿足條件的記錄(演算法內部比較複雜,細節上沒看完,如果有好的見解歡迎提出),這樣就導致了效率的低下。
然後我又做了一個簡單的例子驗證了一下: 1DataTable dt = new DataTable();
 2        dt.Columns.Add("a",typeof(int));
 3        dt.Columns.Add("b",typeof(string));
 4        
 5        for(int i=0;i<1000000;i++)
 6        {
 7            DataRow row = dt.NewRow();
 8            row["a"] = 0;
 9            row["b"] = "2";
10            dt.Rows.Add(row);
11        }
12        long tick = System.DateTime.Now.Ticks;
13        DataRow[] rows = dt.Select("a=0 or (b='1' or b='3' or b='5' or b='6')");
14        System.Console.WriteLine((System.DateTime.Now.Ticks-tick));
15        tick = System.DateTime.Now.Ticks;
16        rows = dt.Select("a=0");
17        System.Console.WriteLine((System.DateTime.Now.Ticks-tick));

在本機測試,發現第一個執行時間是第二個的12倍!

所以在使用該方法時要注意最佳化自己的查詢條件,尤其某個條件能有效縮小查詢範圍時應該考慮先用該條件查詢,然後對結果再執行條件。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.