PHP網頁編碼問題:任一字元集正常顯示網頁的方法

來源:互聯網
上載者:User

通常情況下,我們的網頁要指定一個編碼字元集,如 GB2312、UTF-8、ISO-8859-1 等,這樣我們就可以在網頁上顯示我們指定編碼的文字了。但是我們很可能會遇到這種情況,那就是我們可能希望在 ISO-8859-1 編碼的網頁上顯示漢字,或者在 GB2312 編碼的網頁上顯示韓文等。當然一種解決辦法就是我們不用 ISO-8859-1 或者 GB2312 編碼,而統統都採用 UTF-8 編碼,這樣我們只要在這種編碼下,就可以混合顯示各國文字了,這是現在很多網站採用的方法。

而我這裡所說的並非上面這種方法,因為上面這種方法必須要指定字元集為 UTF-8 才可以,一旦使用者手工指定為其他字元集,或者可能因為某些原因,那個字元集設定沒起作用,而瀏覽器又沒有正確自動識別的話,我們看到的網頁還是亂碼,尤其是在某些用架構作的網頁中,某個架構中的頁面如果字元集設定沒起作用,在 firefox 中顯示亂碼而且還沒法改變(我是說在不裝RightEncode外掛程式的情況下)。

而我這裡介紹的方法即使是把網頁指定為 ISO-8859-1 字元集,也能夠正確顯示漢字、日文等。原理很簡單,就是把除了 ISO-8859-1 編碼中前128個字元以外的所有其他的編碼都用 NCR(Numeric character reference) 來表示。比如“漢字”這兩個字,如果我們寫成“汉字”這種形式,那麼它在任一字元集下都可以正確顯示。根據這個原理,我寫了下面這個程式,它可以把現有的網頁轉化為在任一字元集下都能顯示的網頁。你只需要指定源網頁的字元集和源網頁,點提交按鈕,就可以得到目標網頁了。你也可以只轉化某些文字,只需要把文字填寫到文字框中,並指定這些文字原來的字元集,點提交按鈕,就會在頁面上面顯示編碼後的文字了。

下載: nochaoscode.php

<?php
function nochaoscode($encode, $str, $isemail = false) {
    $str = iconv($encode, "UTF-16", $str);
    for ($i = 0; $i < strlen($str); $i++,$i++) {
        $code = ord($str{$i}) * 256 + ord($str{$i + 1});
        if ($code < 128 and !$isemail) {
            $output .= chr($code);
        } else if ($code != 65279) {
            $output .= "&#".$code.";";
        }
    }
    return $output;
}
$encode = $_POST['encode'];
if ($encode == '') $encode = 'UTF-8';
if ($_FILES['file']['size'] > 0) {
    $data = nochaoscode($encode, file_get_contents($_FILES['file']['tmp_name']));
    header ("Content-type: application/octet-stream;");
    header ("Content-length: ".strlen($data));
    header ("Content-Disposition: attachment; filename=".$_FILES['file']['name']);
    echo $data;
} else {
    header ("Content-type: text/html; charset=UTF-8");
    if ($_POST['email']) {
        echo htmlentities(nochaoscode($encode, $_POST['email'], true));
    }
    else {
        echo htmlentities(nochaoscode($encode, $_POST['content']));
    }
?>
<form enctype="multipart/form-data" method="POST">
encode: <input type="text" name="encode" value="UTF-8" /><br />
file: <input type="file" name="file" /><br />
<input type="submit" />
</form>
<form method="POST">
encode: <input type="text" name="encode" value="UTF-8" /><br />
content: <textarea name="content"></textarea><br />
<input type="submit" />
</form>
<form method="POST">
encode: <input type="text" name="encode" value="UTF-8" /><br />
email: <input name="email" /><br />
<input type="submit" />
</form>
<?php
}
?>



相關文章

E-Commerce Solutions

Leverage the same tools powering the Alibaba Ecosystem

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。