4月11日,string這差距怎麼就這麼大呢

來源:互聯網
上載者:User

今天偶爾處理到了冷僻字這個問題。
我們知道,在c++中如果是這樣一個string a="中國";
那麼它的長度就是4,也就是每個漢字佔兩個位元組
但是在c#中這樣一個語句下來長度就變成了2,後來有人告訴我是因為儲存編碼的方式不同,我還沒怎麼理解
而這麼一來
原有程式有個判別是否為生僻字這一塊
就出現了問題
因為處理過程是把其打到char[](比如“中國”就是四個元素)裡然後取一個漢字的第一個位元組轉換成高位元組判斷再

取一個漢字的低位元組進行判斷
但是在c#中,打到char[],這樣比如“中國”就是兩個元素了,無從談起怎麼判別是否為生僻字了

或許應該換個思路來解決這個問題,還是讓我再好好想一想吧,也希望有高人給我指點一下。

add:其實想實現的功能是把一個漢字的編碼由gbk轉換成unicode的編碼形式

但是我不曉得這個在BS開發上能否用的上,因為也是要求用CS的思路來讓我寫這個方法

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.