php上傳檔案是最最基礎的一個技術點,但是深入進去也有不少問題需要解決,這不,上傳中文檔案後,檔案名稱變成了亂碼。
下面是問題代碼,很簡單:
1.問題代碼
html部分:
複製代碼 代碼如下:
<html>
<body>
<form action="upload_file.php" method="post"
enctype="multipart/form-data">
<label for="file">Filename:</label>
<input type="file" name="file" id="file" />
<br />
<input type="submit" name="submit" value="Submit" />
</form>
</body>
</html>
php部分:
複製代碼 代碼如下:
<?php
if ($_FILES["file"]["error"] > 0)
{
echo "Return Code: " . $_FILES["file"]["error"] . "<br />";
}else
{
echo "Upload: " . $_FILES["file"]["name"] . "<br />";
echo "Type: " . $_FILES["file"]["type"] . "<br />";
echo "Size: " . ($_FILES["file"]["size"] / 1024) . " Kb<br />";
echo "Temp file: " . $_FILES["file"]["tmp_name"] . "<br />";
if (file_exists("upload/" . $_FILES["file"]["name"]))
{
echo $_FILES["file"]["name"] . " already exists. ";
}
else
{
move_uploaded_file($_FILES["file"]["tmp_name"],
"upload/" . $_FILES["file"]["name"]);
}
}
上傳了一個檔案名稱為“測試資料.txt”的檔案,oh ho,檔案是傳上去了,但是檔案名稱為亂碼。
2.初試
網上搜尋一下解決方案,將
複製代碼 代碼如下:
move_uploaded_file($_FILES["file"]["tmp_name"], "upload/" . $_FILES["file"]["name"]);
改成
複製代碼 代碼如下:
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("UTF-8","gbk",$_FILES["file"]["name"]));
結果發現iconv函數傳回值為false。
查一下函數手冊,發現第二個參數有特別的用法,簡單翻譯一下就是我可以在編碼的後面追加//TRANSLIT 或 //IGNORE ,前者會將無法翻譯的字元轉成最接近的字元,後者就是直接忽略不能轉化的字元。
試一下:
複製代碼 代碼如下:
var_dump( iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"]));
var_dump( iconv("UTF-8","gbk//IGNORE",$_FILES["file"]["name"]));
結果:
bool(false) string(4) ".txt"
也就是說中文都沒法轉化,甚至串連近的字元都沒有,看來網上介紹的方法也並非萬能。
3.網上介紹方法失敗,再嘗試
猜測一下,也許我的系統在建立中文檔案的時候會亂碼,於是我將代碼改寫了一下:
複製代碼 代碼如下:
move_uploaded_file($_FILES["file"]["tmp_name"], "upload/測試資料.txt");
結果建立成功,沒有亂碼。。。也就是說不是系統問題。
想一下,我的php檔案本身是utf8編碼的,那麼
複製代碼 代碼如下:
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/測試資料.txt");
這個語句肯定使用的是utf8編碼,那麼之前上傳的檔案名稱肯定就不是utf8編碼了,那麼以下的語句肯定是錯誤的,因為源字串本身就不是utf8編碼的:
複製代碼 代碼如下:
iconv("UTF-8","gbk//TRANSLIT",$_FILES["file"]["name"]);
使用函數檢查源字串的編碼:
複製代碼 代碼如下:
$e=mb_detect_encoding($text, array(‘UTF-8', ‘GBK','gb2312'));
echo $e;
結果是CP936,也就是源字串編碼是GBK。
試一下
複製代碼 代碼如下:
move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . iconv("gbk","UTF-8",$_FILES["file"]["name"]));
問題解決,不再亂碼
4.另一種解決辦法
實際上還有一種解決辦法,就是在html檔案的head標籤中間加入
複製代碼 代碼如下:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
從而使編碼保持統一,也就不需要再轉碼了
5.下面是結論
使用iconv函數可以解決上傳中文檔案名稱亂碼的問題,實際上iconv能解決各種各樣的由於編碼不統一造成的亂碼問題。
使用iconv函數請先檢查源字串的編碼,除非你已經確定了源字串的編碼。
盡量保證所有的代碼的編碼一致,萬不得已才使用iconv函數。
吐槽一下,盡量不使用中文檔案名稱作為伺服器上儲存的檔案名稱,請將檔案名稱轉化成自己的檔案名稱(即使是英文檔案名稱也請轉化一下)。