php中檔案的下載(以及下載的檔案名稱中文亂碼)

來源:互聯網
上載者:User

 <?php<br />//清除緩衝<br />header("Pragma: no-cache");<br />//設定到期時間<br />header("Expires: 0");<br />header("Cache-Component: must-revalidate, post-check=0, pre-check=0");<br />//設定下載的字元集<br />header("Content-type:application/octet-stream;charset=utf-8");<br />/**<br /> *由於檔案名稱UTF-8編碼的, 加上各個瀏覽器的差別,所以下載出來的檔案名稱可能會出現亂碼<br /> * **/<br />//檢查瀏覽頁面的訪問者在用什麼瀏覽器.<br />$ua = $_SERVER["HTTP_USER_AGENT"];<br />//對檔案名稱以 URL 編碼<br />$filename =$this->file_name.".doc";<br />$encoded_filename = urlencode($filename);<br />$encoded_filename = str_replace("+", "%20", $encoded_filename);<br />/**<br /> * filename後面的等號之前要加 *<br />filename的值用單引號分成三段,分別是字元集(utf8)、語言(空)和urlencode過的檔案名稱。<br />最好加上雙引號,否則檔案名稱中空格後面的部分在Firefox中顯示不出來<br />注意urlencode的結果與php的urlencode函數結果不太相同,php的urlencode會把空格替換成+,而這裡需要替換成%20<br />經過實驗,發現幾種主流瀏覽器的支援情況如下:<br />IE6 attachment; filename="<URL編碼之後的UTF-8檔案名稱>"<br />FF3 attachment; filename="UTF-8檔案名稱"<br />attachment; filename*="utf8''<URL編碼之後的UTF-8檔案名稱>"<br />O9 attachment; filename="UTF-8檔案名稱"<br /> * **/<br />if (preg_match("/MSIE/", $ua)) {<br />header('Content-Disposition: attachment; filename="' . $encoded_filename . '"');<br />} else if (preg_match("/Firefox/", $ua)) {<br />header('Content-Disposition: attachment; filename*="utf8/'/'' . $filename . '"');<br />} else {<br />header('Content-Disposition: attachment; filename="' . $filename . '"');<br />}<br />header("Content-Transfer-Encoding: binary");<br />readfile(getcwd().$this->file_path);<br />?>

 

一:引起中文亂碼的原因

        亂碼的出現有2種原因,首先是由於編碼(charset)
設定錯誤,導致瀏覽器以錯誤的編碼來解析,從而出現了滿屏亂七八糟的“天書”,其次是檔案被以錯誤的編碼開啟,然後儲存,比如一個文字檔原先是
GB2312 編碼的,卻以UTF-8 編碼開啟再儲存。要解決上述亂碼問題,首先需要知道開發中哪些環節涉及到了編碼:

1、檔案編碼

2、頁面申明編碼



二、一些常見的錯誤情況與解決:

 

        1、資料庫採用UTF8 編碼,而頁面申明編碼是GB2312
,這是最常見的產生亂碼的原因。這時候在PHP指令碼裡面直接SELECT資料出來的就是亂碼,需要在查詢前先使用: mysql_query("SET
NAMES GBK"); 來設定MYSQL串連編碼,保證頁面申明編碼與這裡設定的串連編碼一致(GBK是GB2312的擴充
)。如果頁面是UTF-8 編碼的話,可以用: mysql_query("SET NAMES UTF8");
注意是UTF8而不是一般用的UTF-8。假如頁面申明的編碼與資料庫內部編碼一致可以不設定串連編碼。
註:事實上MYSQL的資料輸入輸出比上面講的更複雜一些,MYSQL設定檔my.ini中定義了2個預設編碼,分別是[client]裡的
default -character-set和[mysqld] 裡的default-character-set
來分別設定預設時候用戶端串連和資料庫內部所採用的編碼。我們上面指定的編碼其實是MYSQL用戶端串連伺服器時候的命令列參數
character_set_client,來告訴MYSQL伺服器接受到的用戶端資料是什麼編碼的,而不是採用預設編碼。

 

      
2、頁面申明編碼與檔案本身編碼不一致,這種情況很少發生,因為如果編碼不一致美工做頁面時候在瀏覽器看到的就是亂碼了。更多時候是發布以後修改一些小
BUG,以錯誤編碼開啟頁面然後儲存導致的。或者是用某些FTP軟體直接線上修改檔案,比如CuteFTP,由於軟體編碼配置錯誤而導致轉換錯了編碼。



       3、一些租用虛擬機器主機的朋友,明明上述3項編碼都設定正確了還是有亂碼。比方說網頁是GB2312 編碼的,IE等瀏覽器開啟卻總是識別成UTF-8
,網頁HEAD裡面已經申明是GB2312 了,手動修改瀏覽器編碼為GB2312
後頁面顯示正常。產生原因是伺服器Apache設定了伺服器全域的預設編碼,在httpd.conf裡面加了AddDefaultCharset
UTF-8
。這時候伺服器會首先發送HTTP頭給瀏覽器,其優先順序比頁面裡申明編碼高,自然瀏覽器就識別錯了。解決辦法有2個,請管理員在設定檔自己的虛機裡加上
一條AddDefaultCharset GB2312 來覆蓋全域配置,或者在自己目錄的.htaccess裡配置。


總結:總之一句話,要解決php中文亂碼,必須保證編碼格式一致


聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.