[轉]PHP開發中涉及到emoji表情的三種處理方法

來源:互聯網
上載者:User

標籤:function   mat   class   圖片   刪除字串   return   處理   UNC   三方   

最近幾個月做開發比較多,儲存暱稱必不可少,可這萬惡的支援emoji表情做暱稱,這就有點蛋疼了

一般Mysql表設計時,都是用UTF8字元集的。把帶有emoji的暱稱欄位往裡面insert一下就沒了,整個欄位變成了Null 字元串。這是怎麼回事呢?

原來是因為Mysql的utf8字元集是3位元組的,而emoji是4位元組,這樣整個暱稱就無法儲存了。這要怎麼辦呢?我來介紹幾種方法

1、使用utf8mb4字元集

如果你的mysql版本>=5.5.3,你大可直接將utf8直接升級為utf8mb4字元集
這種4位元組的utf8編碼可完美相容舊的3位元組utf8字元集,並且可以直接儲存emoji表情,是最好的解決方案
至於位元組增大帶來的效能損耗,我看過一些評測,幾乎是可以忽略不計的

2、使用base64編碼

如果你因為某些原因無法使用utf8mb4的話,你還可以使用base64來曲線救國
使用例如base64_encode之類的函數編碼過後的emoji可以直接儲存在utf8位元組集的資料表中,取出時decode一下即可

3、幹掉emoji表情

emoji表情是個麻煩的東西,即使你能儲存,也不一定能完美顯示。在iOS以外的平台上,例如PC或者android。如果你需要顯示emoji,就得準備一大堆emoji圖片並使用第三方前端類庫才行。即便如此,還是可能因為emoji圖片不夠全而出現無法顯示的情況
在大多數業務情境下,emoji也不是非要不可的。我們可以適當地考慮幹掉它,節約各種成本

經過一番苦苦的google,終於找到靠譜能用的代碼:

// 過濾掉emoji表情function filterEmoji($str){    $str = preg_replace_callback(            ‘/./u‘,            function (array $match) {                return strlen($match[0]) >= 4 ? ‘‘ : $match[0];            },            $str);     return $str; }

原理:基本思想就是遍曆字串中的每個字元,如果該字元的長度為4個位元組,就將其刪除。

參考

1.PHP開發中涉及到emoji表情的幾種處理方法

2.PHP刪除字串中的emoji表情

擴充

nodejs,javascript過濾emoj表情

[轉]PHP開發中涉及到emoji表情的三種處理方法

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.