有些時候,我們對一些內容,清理掉HTML標記,只保留純內容或一部分內容,例如下面的一段:
<SPAN class = InsertWordsDisplay>這裡不要</span>只要這裡<SPAN class=\"InsertWordsDisplay\">不要(*)</span>
對上面的這段代碼,我們只要藍色的內容,也就是“凡是被HTML標記包圍的內容,都不要了”
C# 的實現方式:
string strToBeFiltered = "<SPAN class = InsertWordsDisplay>這裡不要</span>只要這裡<SPAN class=\"InsertWordsDisplay\">不要(*)</span>";Regex reg = new Regex("<span\\s+class\\s{0,}=\\s{0,}\"{0,1}InsertWordsDisplay\"{0,1}>.+?</span>", RegexOptions.IgnoreCase | RegexOptions.Multiline);string strFiltered = reg.Replace(strToBeFiltered, "");
上面的 strFiltered 就是最終的結果了
Javascript 的實現方式:
<script type="text/javascript"> var strToBeFiltered = '<SPAN class = InsertWordsDisplay>不要</span>要<SPAN class="InsertWordsDisplay">不要(*)</span>'; var pattern = /<span\s+class\s{0,}=\s{0,}"{0,1}InsertWordsDisplay"{0,1}\s{0,}>.+?<\/span>/ig; var strFiltered = strToBeFiltered.replace(pattern, ''); alert(strFiltered);</script>
希望起個拋磚引玉的作用吧