網友wys提問:如何僅使用JavaScript支援的正則文法,將
複製代碼 代碼如下:<p>
<table> <p> <p> </table>
<table> <p> <p> </table>
<p>
中<table>...</table>之間的<p>都替換為<br/>?
思考
該問題的痛點之一在於JavaScript支援的正則特性實在有限。樓主已經想到了非JavaScript的解法,如下: 複製代碼 代碼如下:re=/(?<=<table.*?)(<p>)(?=.*?<\/table>)/gi;
alert (sourcestr.replace(re,"<br>"));
嗯,思路大致是這樣。較真起來,即使JavaScript支援逆序環視,上面答案並不能夠如願運行。原因是帶有量詞的逆序環視(即在(?<=)裡面使用?, *, +, {}這樣的量詞)是更進階的的文法,極少有語言能夠支援(特例是.Net)。
但是,像樓主這樣的正則問題應該是很普便的一個問題,我們經常需要迴圈地替換一些內容。該如何解答呢?
思路一
閱讀JavaScript的文檔,我找到了lastIndex這樣的東東。根據這個東東,我形成了這樣的思路:
•先按外層迴圈,找到第一組較大的匹配。正則代碼是<table[^>]*>[\s\S]*?<\/table>
•定位到這次匹配結束的起始位置,替換掉這一段字串中所有的<p>。
•迴圈執行。
我覺得上述思路大致清晰,但是細節太多(每次匹配涉及3個位置點,一個長度),解起來並非從容不迫,最終的代碼想必也不會賞心悅目;尤為重要的是,整個思路像是原始的 Crack,而不是高手的 Hack 。而且思路與正則關係不大。我決定換一條路。
思路二
關鍵是迴圈和嵌套。還好不是盜夢空間的深層遞迴。能否將匹配的內容保護起來,替換完之後再放回原位呢?
想到這裡,就豁然開朗了。
思路:先找到所有的匹配內容,記路在數組inner中;
同時使用該正則,將原字串split為另一個數組wrapper;
一個重要的特點是,wrapper一定比inner多一個元素,它一一將inner項隔開,並處於最外層。wrapper 和 inner 的關係,就像是一個手掌的5根指頭與4個指縫的關係。將中間的元素取出,記下位置,等處理完之後,再將所有的元素粘合在一起。就是這樣簡單。代碼如下(為了讓問題更有普使性,我稍改了一下源字串):
複製代碼 代碼如下:<script type="text/javascript">
var str="<p> <table> <p> ,<p> </table> <p> <table> <p> <p> </table> <p> <table> <p> <p> </table>";
var patt=/<table[^>]*>[\s\S]*?<\/table>/i;
var wrapper_result=str.split(patt);
var inner_result = str.match(/<table[^>]*>[\s\S]*?<\/table>/ig);
var len=inner_result.length;
var final=wrapper_result[0];
for (i=0; i<len; i++)
{
tmp=inner_result[i].replace(/<p>/gi,"<br>");
final+=tmp+wrapper_result[i+1];
}
alert(final);
</script>
貼圖:
更新
果然是能人輩出,評論更精彩!請看評論中的這則代碼: 複製代碼 代碼如下: alert(sourcestr.replace(/<table.*?\/table>/ig, function($1){return $1.replace(/<p>/ig,"<br>")}));
PS: 本站剛剛添加了評論中代碼的解析,可以貼代碼了。格式見評論部分的圖例顯示。謝謝合作!