C cgi url 編碼解碼問題

來源:互聯網
上載者:User
這幾天在學慣用C寫CGI程式呢,第一個遇到的問題就是編碼了。

0~9 a~z A~Z這些字元是不會被編碼的,但是比如一些特殊字元或是中文,post或get資料時,會對資料自動進行編碼,比如漢字'中',如果頁面採用的是gb2312編碼,'中'字會被編碼為'%D6%D0',忽略'%'標識,兩個十六進位數,即0xD6,0xD0,六個字元。如果頁面是utf-8編碼,'中'字會被編碼為'%D6%D0%AD',忽略'%'標識,三個十六進位數,即0xD6,0xD0,0xAD,九個字元。


解碼時,比如gb編碼,要將六個字元變成兩個字元,即把字元處理後,可以將兩個十六進位數轉換為兩個十進位數,然後強制轉換為兩個字元。0xD6,214,0xD0,208;
char *encode="%D6%D0";

char decode[3];

decode[0]=214;//%D6,0xD6

decode[1]=208;//%D0,0xD0

decode[2]='\0';

printf("%s\n",decode);//輸出'中'。

utf-8編碼解碼是同樣的原理。
char *encode="%D6%D0%AD";

char decode[4];

decode[0]=228;//%E4,0xE4

decode[1]=284;//%B8,0xB8

decode[2]=173;//%AD,0xAD

decode[3]='\0';

printf("%s\n",decode);//輸出'中'。


可以看出來,採用utf-8,中文編碼會使儲存空間變大。對於解碼,需要個十六進位到十進位的轉換函式,很簡單了就可以實現了。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.