在C#中使用Regex自動匹配並擷取所需要的資料

來源:互聯網
上載者:User
Regex能根據設定匹配各種資料(比如:e-mail地址,電話號碼,身份中號碼等等)。Regex功能強大,使用靈活,C#,Java,JavaScript等多種語言都支援Regex。在互連網上“抓取資料”更是少不了使用Regex。今天我要說的是在C#中使用Regex自動匹配並擷取所需要的資料。

從下面是某個IP查詢網站返回查詢結果的一個部分(字串),現在就是要從這個字串中擷取“查詢結果1:”後面的“北京市 網通”。<td align="center"><ul><li>查詢結果1:北京市 網通</li><li>查詢結果2:北京市 網通</li><li>查詢結果3:北京市 網通</li></ul></td>

C#相關代碼如下:string srcString = "<td align=\"center\"><ul><li>查詢結果1:北京市 網通</li><li>查詢結果2:北京市 網通</li><li>查詢結果3:北京市 網通</li></ul></td>";
// 匹配 "<li>查詢結果1:" 與 "</li>" 之間的所有字元的Regex
string regexStr = "<li>查詢結果1:(?<key>.*?)</li>";
Regex r = new Regex(regexStr, RegexOptions.None);
Match mc = r.Match(srcString);
string dataStr = mc.Groups["key"].Value;

說明:
這裡最關鍵的是設定Regex:"<li>查詢結果1:(?<key>.*?)</li>"。

字元

描述

<key>

根據key擷取由Regex匹配的值。

.

匹配除 "\n" 之外的任何單個字元。

*

匹配前面的子運算式零次或多次。

?

跟在任何一個其他限制符(*, +, ?, {n}, {n,}, {n,m})後面時,匹配模式是非貪婪的;非貪婪模式儘可能少的匹配所搜尋的字串,而預設的貪婪模式則儘可能多的匹配所搜尋的字串。

dataStr 就是我們要得的資料:“北京市 網通”。

相關文章:使用WebClient自動填寫並提交ASP.NET頁面表單的原始碼
             使用WebClient自動填寫並提交ASP.NET頁面表單

本文地址:http://www.cnblogs.com/anjou/archive/2007/03/20/681744.html

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.