在php中使用sockets:從新聞群組中擷取文章_PHP
來源:互聯網
上載者:User
關鍵字
擷取
文章
新聞
使用
伺服器
一個
usenet_han
PHP能開啟遠程或本地主機上的Socket連接埠。本文是一個使用Socket的小例子:連
接到一個Usenet新聞群組伺服器,同伺服器對話,從新聞群組中下載一些文章。
在php中開啟一個socket
使用fsockopen()開啟一個socket.這個函數在php3和php4種都可以使用。函式宣告
是這樣的:
int fsockopen (string hostname, int port [, int errno [, string errstr [, double timeout]]])
這個函數將開啟一個串連到主機hostname的port連接埠的TCP串連。hostname可以是一
個有效網域名稱,或者是一個ip地址。對於udp串連,你必須指定協議:udp://hostname.
對於unix域,主機名稱使用到socket的路徑,這種情況下,連接埠port必須置為0。可選
的timeout參數用來設定等待開啟一個socket的時間,單位為秒。
關於fsockopen()的更多資訊,請參考:h
ttp://www.php.net/manual/function.fsockopen.php
網路新聞傳輸通訊協定
訪問新聞群組伺服器需要通過稱為NNTP(網路新聞傳輸通訊協定)的協議來進行。這個協議
在rfc977中有詳細的細節,可以在http://www.w3.org/Protocols/rfc977/rfc977.html
得到。這個文檔分別描述了怎樣串連到NNTP伺服器,怎樣同伺服器對話,以及完成這
些任務的不同命令。
串連
串連到一個NNTP伺服器需要知道它的主機名稱(或者是ip地址)和它偵聽的連接埠。為了
避免一個串連企圖失敗導致程式掛起,你應該使用timeout參數。
$cfgServer = "your.news.host";
$cfgPort = 119;
$cfgTimeOut = 10;
//open a socket
if(!$cfgTimeOut)
// without timeout
$usenet_handle = fsockopen($cfgServer, $cfgPort);
else
// with timeout
$usenet_handle = fsockopen($cfgServer, $cfgPort, &$errno, &$errstr, $cfgTimeOut);
if(!$usenet_handle) {
echo "Connection failed.n";
exit();
}
else {
echo "Connected.n";
$tmp = fgets($usenet_handle, 1024);
}
?>
與伺服器對話
現在我們已經串連到了伺服器,可以通過前面開啟的socket同伺服器對話了。比如
說我們要從某個新聞群組得到最近的10篇文章。RFC977指出,第一步要用GROUP命令選擇
正確的新聞群組:
GROUP ggg
參數ggg是要選擇的新聞群組的名字(比如說是"net.news"),這是必需的。可用的新
聞組的列表可以用LIST命令得到。選擇新聞群組的命令成功後,返回組中第一篇和最
後一篇文章的文章編號,以及組中文章的數目。
下面是一個例子:
chrome:~$ telnet my.news.host 119
Trying aa.bb.cc.dd...
Connected to my.news.host.
Escape character is '^]'.
200 my.news.host InterNetNews NNRP server INN 2.2.2 13-Dec-1999 ready (posting ok).
GROUP alt.test
211 232 222996 223235 alt.test
quit
205 .
接收到命令 GROUP alt.test 後,伺服器返回"211 232 222996 223235 alt.test".
211是RFC中定義的返回碼,指示命令已成功執行。返回資訊還指出,現在有232篇文
章,最早的文章的編號是222996,最新的文章的編號是223235。我們看到,
222996+232並不等於223235。丟失的7篇文章因為某種原因被從伺服器刪除了,可能
是因為被它的合法作者取消了(這是可能的,而且很容易做到),或者因為是灌水文
章而被刪。
需要注意的事,有些伺服器在選擇新聞群組之前可能要求身份認證,這取決於這是一個
公用的或者是私用的伺服器。也有可能伺服器允許任何人讀取文章,但發表文章需要
身分識別驗證。
//$cfgUser = "xxxxxx";
//$cfgPasswd = "yyyyyy";
$cfgNewsGroup = "alt.php";
//identification required on private server
if($cfgUser) {
fputs($usenet_handle, "AUTHINFO USER ".$cfgUser."n");
$tmp = fgets($usenet_handle, 1024);
fputs($usenet_handle, "AUTHINFO PASS ".$cfgPasswd."n");
$tmp = fgets($usenet_handle, 1024);
//check error
if($tmp != "281 Okrn") {
echo "502 Authentication errorn";
exit();
}
}
//select newsgroup
fput($usenet_handle, "GROUP ".$cfgNewsGroup."n");
$tmp = fgets($usenet_handle, 1024);
if($tmp == "480 Authentication required for commandrn") {
echo $tmp;
exit();
}
$info = split(" ", $tmp);
$first= $info[2];
$last = $info[3];
printf("First : %sn", $first);
printf("Last : %lastn", $last);
?>