因工作需要,需要採集html,並把html內容儲存到資料庫中。為了避免影響使用,寬高樣式需要刪除。例片和p中的width, height等。
不過採集到的html中,樣式的寫法各有不同,例如大小寫,中間有空格等。
因此使用php正則編寫了下面這個方法,對這些奇葩的樣式進行過濾。
代碼如下:
<?php/** * 清除寬高樣式 * @param String $content 內容 * @return String */function clear_wh($content){ $config = array('width', 'height'); foreach($config as $v){ $content = preg_replace('/'.$v.'\s*=\s*\d+\s*/i', '', $content); $content = preg_replace('/'.$v.'\s*=\s*.+?["\']/i', '', $content); $content = preg_replace('/'.$v.'\s*:\s*\d+\s*px\s*;?/i', '', $content); } return $content;}?>
示範:
<?php$html = <<<HTML<p style="text-align:center" width="500" height="300"> <p style="Width : 100px ; Height: 100 px;"> <img src="/images/test.jpg" width=400 height = 200> <p style="float:left; width: 100px; height : 200 px;"></p> </p> <p style="width : 100 px ;height: 100px"> <img src="/images/test.jpg" width=400 height = 200> </p></p>HTML;echo '<xmp>';echo '原內容:'.PHP_EOL;echo $html.PHP_EOL.PHP_EOL;echo '過濾後內容:'.PHP_EOL;echo clear_wh($html);echo '</xmp>';?>
輸出:
原內容:<p style="text-align:center" width="500" height="300"> <p style="Width : 100px ; Height: 100 px;"> <img src="/images/test.jpg" width=400 height = 200> <p style="float:left; width: 100px; height : 200 px;"></p> </p> <p style="width : 100 px ;height: 100px"> <img src="/images/test.jpg" width=400 height = 200> </p></p>過濾後內容:<p style="text-align:center" > <p style=" "> <img src="/images/test.jpg" > <p style="float:left; "></p> </p> <p style=""> <img src="/images/test.jpg" > </p></p>
本文講解了php使用正則去除寬高樣式,更多相關內容請關注php中文網。
相關推薦:
mysql表資料行列轉換方法
nginx快速查看設定檔的方法
php 多個一維數組合拼成二維數組的方法