如何在lua指令碼中使用Unicode是本文要介紹的內容,主要是來學習Unicode在lua指令碼中如何使用,具體內容來看本文詳細內容講解。說說最近的幾個事情:
1、project採用lua,ui模組肯定是要徹底使用utf-16的,可是lua不支援,怎麼辦?最後好像是寫了userdata,可以將multibytes轉成utf-16儲存在這個userdata中;接著為了保證字串相同的userdata做key時是相同的,於是又添加了相應的避免重複功能;最後還為這個userdata在gc方面作了保證。
2、google:lua unicode,會發現一份通過table使用unicode的文章傳得很廣,實際上很不實用——需要工具,字串不可讀。
3、魔獸世界的lua指令碼儲存格式為utf-8,他的指令碼中有一段是直接寫文字資訊的,所以這種儲存格式比較有利。
4、看過戰錘OL的外掛程式,無意中看到類似 s = L"戰錘OL" 的代碼,心想難道lua支援unicode了?試了一下發現沒有,於是覺得是不是他們的程式修改了lua的parser了。不久後的現在,腦袋終於開竅了。
其實不少實力派的前人早就強調過lua在unicode方面的解決方案了:lua string是一個raw buffer,可以存放任意資料。這個說法雖然正確卻太抽象,因為他們都沒有交代過具體的實現手法。
我們想要的所謂支援unicode的lua,到底是什麼意思呢,最基礎的大概就是能像c那樣,用L作為字串的首碼,並能將字串賦值到變數上,就像上面的
- s = L"戰錘OL"
注意這句代碼,你看出什麼了嗎?再明確一些
- s = L("戰錘OL")
感謝lua這種可忽略的寫法,可以讓lua寫一些很漂亮的內容,除了string,還有table。
只要L是一個函數,接受multibytes字串作為參數,轉化為utf-16,然後將utf-16的字串交給lua string,壓棧。
這裡要回頭說說最上面所說的project,我不需要userdata了,因為他可以是一個lua string,相同的字串做key的同質性?gc?通通都交給lua string吧,這裡沒你的事了。
最後,貼一下代碼,收功
- int utf8_to_utf16(lua_State* L)
- {
- size_t n = 0;
- char* str = (char*)luaL_checklstring(L, -1, &n);
- if(!str)
- return 0;
- iconv_t h = iconv_open("utf-16", "utf-8");
- if(0==h)
- return 0;
-
- char wstr[4096];
- size_t wn = 4096;
- char** ppsrc = &str;
- char* dst = wstr;
- char** ppdst = &dst;
- int ret = iconv(h, ppsrc, &n, ppdst, &wn);
- if(ret==-1 || wn<0 || n>0)
- {
- iconv_close(h);
- return 0;
- }
- iconv_close(h);
- lua_pushlstring(L, (char*)wstr, (4096-wn));
- return 1;
- }
- //here here
- lua_register(L, "L", utf8_to_utf16);
小結:詳解如何在lua指令碼中使用Unicode的內容介紹完了,希望通過本文的學習能對你有所協助!