R語言爬蟲:CSS方法與XPath方法對比(表格介紹)

來源:互聯網
上載者:User

標籤:標題   eve   tab   三級   爬蟲   無法   value   nta   api   

  • css 選取器與 xpath 用法對比
目標 匹配節點 CSS 3 XPath
所有節點 ~ * //*
尋找一級、二級、三級標題區段點 <h1>,<h2>,<h3> h1,h2,h3 //h1,//h2,//h3
所有的P節點 <p> p //p
p節點的所有子節點 <p>標籤下的所有節點 p > * //p/*
尋找所有包含attr屬性的li標籤 <li attr="~"> li[attr] li[@attr]
尋找所有attr值為value的li標籤 <li attr="value"> li[attr=value] //li[@attr=‘value‘]
尋找id值為item的所有div節點 <div id="item"> div#item //div[@id=‘item‘]
尋找class值中包含foo的所有標籤 <* class="foo blahblah"> .foo //*[contains(@class,‘foo‘)]
第一個P節點 眾多<p>中的第一個 <p> p:first-child //p[1]
第n個P節點 眾多<p>中的第n個 <p> p:nth-child //p[n]
擁有子節點a的所有P節點 <p><a></p> css無法實現 //p[a]
尋找常值內容是“Web Scraping”的p節點 <p>Web Scraping</p> css無法實現 //p[text()="Web Scraping"]

R語言爬蟲:CSS方法與XPath方法對比(表格介紹)

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.