c#獲得網頁中HTML的標題

來源:互聯網
上載者:User

using System;
using System.IO;
using System.Text.RegularExpressions;
using System.Collections.Generic;
using System.Text;
using System.Net;

namespace ConsoleApplication1
{
    class Program
    {
        static void Main(string[] args)
        {
            WebRequest oRequest = WebRequest.Create("http://www.baidu.com/");
            WebResponse oResponse = oRequest.GetResponse();

            StreamReader oReader = new StreamReader(oResponse.GetResponseStream(),Encoding.GetEncoding("GB2312"));

            string html = oReader.ReadToEnd();

            Match m = Regex.Match(html, "<title>(.*)</title>");

            if (m.Groups.Count == 2)
                Console.WriteLine(m.Groups[1].Value);

            Console.ReadLine();
        }
    }
}

這段代碼適合取出HTML下指定標記塊下的內容,但是由於HTML很難嚴格的說其是結構化的資料,所以並不是所有的標記內容都能取出,比如網頁中會存在多個<td></td>,那麼要取的內容存在於哪對標記中就很難判斷.
應用到的命名空間:
using System.Net.其下有WebRequest和WebResponse
using System.IO.用到StreamReader
using System.Text.RegularExpressions.Regex,比截取字串要好用的多

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.