在php中使用sockets:從新聞群組中擷取文章

來源:互聯網
上載者:User
關鍵字 在php中使用sockets:從新聞群組中擷取文章

php能開啟遠程或本地主機上的Socket連接埠。本文是一個使用Socket的小例子:串連到一個Usenet新聞群組伺服器,同伺服器對話,從新聞群組中下載一些文章。


在php中開啟一個socket
使用fsockopen()開啟一個socket.這個函數在php3和php4種都可以使用。函式宣告是這樣的:


int fsockopen (string hostname, int port _
[, int errno [, string errstr [, double timeout]]])


這個函數將開啟一個串連到主機hostname的port連接埠的TCP串連。hostname可以是一個有效網域名稱,或者是一個ip地址。對於udp串連,你必須指定協議:udp://hostname. 對於unix域,主機名稱使用到socket的路徑,這種情況下,連接埠port必須置為0。可選的timeout參數用來設定等待開啟一個socket的時間,單位為秒。


關於fsockopen()的更多資訊,請參考:http://www.php.net/manual/function.fsockopen.php


網路新聞傳輸通訊協定
  訪問新聞群組伺服器需要通過稱為NNTP(網路新聞傳輸通訊協定)的協議來進行。這個協議在rfc977中有詳細的細節,可以在http://www.w3.org/PRotocols/rfc977/rfc977.html得到。這個文檔分別描述了怎樣串連到NNTP伺服器,怎樣同伺服器對話,以及完成這些任務的不同命令。


串連
  串連到一個NNTP伺服器需要知道它的主機名稱(或者是ip地址)和它偵聽的連接埠。為了避免一個串連企圖失敗導致程式掛起,你應該使用timeout參數。
     $cfgServer  = "your.news.host";
   $cfgPort   = 119;
   $cfgTimeOut = 10;

//open a socket
   if(!$cfgTimeOut)
     // without timeout
     $usenet_handle = fsockopen($cfgServer, $cfgPort);
   else
     // with timeout
     $usenet_handle = fsockopen($cfgServer, $cfgPort, &$errno, &$errstr, $cfgTimeOut);

if(!$usenet_handle) {
     echo "Connection failed.\n";
     exit();
   }
   else {
     echo "Connected.\n";
     $tmp = fgets($usenet_handle, 1024);
   }

?>
與伺服器對話

現在我們已經串連到了伺服器,可以通過前面開啟的socket同伺服器對話了。比如說我們要從某個新聞群組得到最近的10篇文章。RFC977指出,第一步要用GROUP命令選擇正確的新聞群組:
GROUP ggg
參數ggg是要選擇的新聞群組的名字(比如說是"net.news"),這是必需的。可用的新聞群組的列表可以用LIST命令得到。選擇新聞群組的命令成功後,返回組中第一篇和最後一篇文章的文章編號,以及組中文章的數目。
 

下面是一個例子:
  Chrome:~$ telnet my.news.host 119
  Trying aa.bb.cc.dd...
  Connected to my.news.host.
  Escape character is '^]'.
  200 my.news.host InterNetNews NNRP server INN 2.2.2 13-Dec-1999 ready (posting ok).
  GROUP alt.test
  211 232 222996 223235 alt.test
  quit
  205 .

  接收到命令 GROUP alt.test 後,伺服器返回"211 232 222996 223235 alt.test". 211是RFC中定義的返回碼,指示命令已成功執行。返回資訊還指出,現在有232篇文章,最早的文章的編號是222996,最新的文章的編號是223235。我們看到,222996+232並不等於223235。丟失的7篇文章因為某種原因被從伺服器刪除了,可能是因為被它的合法作者取消了(這是可能的,而且很容易做到),或者因為是灌水文章而被刪。
 

需要注意的事,有些伺服器在選擇新聞群組之前可能要求身份認證,這取決於這是一個公用的或者是私用的伺服器。也有可能伺服器允許任何人讀取文章,但發表文章需要身分識別驗證。

     
   //$cfgUser  = "xxxxxx";
   //$cfgPasswd = "yyyyyy";
   $cfgNewsGroup = "alt.php";

//identification required on private server
   if($cfgUser) {
     fputs($usenet_handle, "AUTHINFO USER ".$cfgUser."n");
     $tmp = fgets($usenet_handle, 1024);
     fputs($usenet_handle, "AUTHINFO PASS ".$cfgPasswd."n");
     $tmp = fgets($usenet_handle, 1024);

   //check error

     if($tmp != "281 Okrn") {
       echo "502 Authentication errorn";
       exit();
     }
}
 
//select newsgroup
 
fput($usenet_handle, "GROUP ".$cfgNewsGroup."n");
$tmp = fgets($usenet_handle, 1024);
 
if($tmp == "480 Authentication required for commandrn") {
   echo $tmp;
   exit();
}
 
$info = split(" ", $tmp);
$first= $info[2];
$last = $info[3];
 
printf("First : %sn", $first);
printf("Last : %lastn", $last);

?>

  • 相關文章

    聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.