正則-php提取頁面中網域名稱規則問題!

來源:互聯網
上載者:User
關鍵字 正則 php
正則php

一套程式中需要在指定的URL頁面中提取裡面所有的網域名稱,現代碼如下:

  $CODE = ......;//這裡是擷取遠端URL內容        $temp = "//i";        preg_match_all( $temp, $CODE, $Jzz_thlld );        $Jzz_thlld = $Jzz_thlld[0];        $temp = "/ href=[\"']?http:\\/\\/www\\.([^>\"' ]+)[\"']?\\s*[^>]*>(.*)<\\/a>/si"; for ($dos_skipping = 0; $dos_skipping < sizeof( $Jzz_thlld ); $dos_skipping++ )        {            preg_match( $temp, $Jzz_thlld[$dos_skipping], $tempurl );            if ( !( $tempurl[1] != "" ) && !( strpos( $tempurl[1], "?" ) === FALSE ) && !( strpos( $tempurl[1], "&" ) === FALSE ) && !( strpos( $tempurl[1], "#" ) === FALSE ) && !( strpos( $tempurl[1], ":" ) === FALSE ) && !( strpos( $tempurl[1], " " ) === FALSE ) )            {                echo '99';                $url_temp = "www.".$tempurl[1];                if ( 0 < strpos( $url_temp, "/" ) )                {                    $url_arr = explode( "/", $url_temp );                    $url_temp = $url_arr[0];                }                if ( $Jzz_cbgsf == "" )                {                    $Jzz_cbgsf = $url_temp;                }                else if ( strpos( "||".$Jzz_cbgsf."||", "||".$url_temp."||" ) === FALSE )                {                    $Jzz_cbgsf .= "||".$url_temp;                }            }        }

上述代碼中不能按照需求萃取到所需要的資訊,忘各位幫忙看看,改如何修改!!

  • 相關文章

    聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.