需要提取的內容如下:
<a href="http://baidu.com">http://baidu.com</a>這是第一個A標籤,
<a href="http://blog.baidu.com">成長腳印-專註於互連網發展</a>這是第二個A標籤。
http://www.111cn.net這是第一個需要被提取的URL地址,
http://blog.baidu.com這是第二個需要被提取的URL地址'。
<img border="0" alt="" src="yun_qi_img/error.html">,這是一個IMG標籤
類似微博中的自動提取URL為超連結位址。即將紅色標記的內容提取出來添加A標籤,轉換成真正的超連結。網上搜尋了很久,沒有找到一個切實可行的解決方案。大都只是簡單的提取URL(A標籤和IMG標籤內的地址也被提取替換了),並不能滿足以上需求。Regex中也沒發現能夠實現提取時過濾掉A標籤的方法。於是轉換了一下思路,“曲線救國”。即,先將所有的A標籤和IMG標籤正則替換為某一個統一的標記,然後再提取URL地址替換為超連結,最後再將統一的標記還原替換為以前的A標籤和IMG標籤便解決了。
代碼如下 |
複製代碼 |
function linkAdd($content){ //提取替換出所有A標籤(統一標記<{link}>) preg_match_all('/<a.*?href=".*?".*?>.*?</a>/i',$content,$linkList); $linkList=$linkList[0]; $str=preg_replace('/<a.*?href=".*?".*?>.*?</a>/i','<{link}>',$content); //提取替換出所有的IMG標籤(統一標記<{img}>) preg_match_all('/<img[^>]+>/im',$content,$imgList); $imgList=$imgList[0]; $str=preg_replace('/<img[^>]+>/im','<{img}>',$str); //提取替換標準的URL地址 $str=preg_replace('(((f|ht){1}tp://)[-a-zA-Z0-9@:%_/+.~#?&//=]+)','<a href="\0" target="_blank">\0</a>',$str); //還原A統一標記為原來的A標籤 $arrLen=count($linkList); for($i=0;$i<$arrLen;$i++){ $str=preg_replace('/<{link}>/',$linkList[$i],$str,1); } //還原IMG統一標記為原來的IMG標籤 $arrLen2=count($imgList); for($i=0;$i<$arrLen2;$i++){ $str=preg_replace('/<{img}>/',$imgList[$i],$str,1); } return $str; } $content=' <a href="http://baidu.com">http://baidu.com</a>這是第一個A標籤, <a href="http://blog.baidu.com">成長腳印-專註於互連網發展</a>這是第二個A標籤。 http://www.111cn.net這是第一個需要被提取的URL地址, http://blog.baidu.com這是第二個需要被提取的URL地址。 <img border="0" alt="" src="yun_qi_img/error.html">,這是一個IMG標籤'; echo linkAdd($content); |
返回的內容為:
<a href="http://baidu.com">http://baidu.com</a>這是第一個A標籤, <a href="http://blog.baidu.com">成長腳印-專註於互連網發展</a>這是第二個A標籤。 <a href="http://www.111cn.net" target="_blank">http://www.111cn.net</a>這是第一個需要被提取的URL地址, <a href="http://blog.baidu.com" target="_blank">http://blog.baidu.com</a>這是第二個需要被提取的URL地址。
<img border="0" alt="" src="yun_qi_img/error.html">,這是一個IMG標籤
即為我們想要的內容。
例2,
代碼如下 |
複製代碼 |
/** * PHP 版本 在 Silva 代碼的基礎上修改的 * 將URL地址轉化為完整的A標籤連結代碼 */ /** ============================================= NAME : replace_URLtolink() VERSION : 1.0 AUTHOR : J de Silva DESCRIPTION : returns VOID; handles converting URLs into clickable links off a string. TYPE : functions ============================================= */ function replace_URLtolink($text) { // grab anything that looks like a URL... $urls = array(); // build the patterns $scheme = '(https?://|ftps?://)?'; $www = '([w]+.)'; $ip = '(d{1,3}.d{1,3}.d{1,3}.d{1,3})'; $name = '([w0-9]+)'; $tld = '(w{2,4})'; $port = '(:[0-9]+)?'; $the_rest = '(/?([w#!:.?+=&%@!-/]+))?'; $pattern = $scheme.'('.$ip.$port.'|'.$www.$name.$tld.$port.')'.$the_rest; $pattern = '/'.$pattern.'/is'; // Get the URLs $c = preg_match_all($pattern, $text, $m); if ($c) { $urls = $m[0]; } // Replace all the URLs if (! empty($urls)) { foreach ($urls as $url) { $pos = strpos('http://', $url); if (($pos && $pos != 0) || !$pos) { $fullurl = 'http://'.$url; } else { $fullurl = $url; } $link = ''.$url.''; $text = str_replace($url, $link, $text); } } return $text; } |
例一測試過,例二沒有測試過大家測試一下看那個好用用那個吧。