Emoji表情在AndroidJNI中的兼容性問題分析是怎樣的

這篇文章跟大家分析一下“Emoji表情在AndroidJNI中的兼容性問題分析是怎樣的”。內(nèi)容詳細易懂，對“Emoji表情在AndroidJNI中的兼容性問題分析是怎樣的”感興趣的朋友可以跟著小編的思路慢慢深入來閱讀一下，希望閱讀后能夠?qū)Υ蠹矣兴鶐椭?。下面跟著小編一起深入學習“Emoji表情在AndroidJNI中的兼容性問題分析是怎樣的”的知識吧。

在羅平等地區(qū)，都構建了全面的區(qū)域性戰(zhàn)略布局，加強發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力，以專注、極致的服務理念，為客戶提供做網(wǎng)站、成都網(wǎng)站設計網(wǎng)站設計制作定制開發(fā),公司網(wǎng)站建設,企業(yè)網(wǎng)站建設,高端網(wǎng)站設計,成都全網(wǎng)營銷推廣,外貿(mào)網(wǎng)站建設,羅平網(wǎng)站建設費用合理。

起因

最近遇到一個問題，把某個字符串計算MD5，之后把該字符串加密與MD5一起上傳到服務端，服務端解密后重新計算md5發(fā)現(xiàn)與上傳的MD5不一致，而出問題的字符串中無一例外都有Emoji表情。但我自己弄個帶表情的字符串上傳卻沒有什么問題。

最終確認這是在Android 5.1以下 jstring -> char數(shù)組時出的問題。下面通過一個示例來還原這個過程。

事件還原

假設有一個字符串s，String s = "\uD83D\uDC8B"; ，對應表情?。通過調(diào)用getBytes()方法，會看到對應的byte數(shù)組為[-16, -97, -110, -117] ，按16進制輸出為[f0, 9f, 92, 8b] 。

定義一個參數(shù)為String的native方法，public native String test(String str); ，在對應的C/C++代碼中，通過env->GetStringUTFChars獲取傳入的String對應的char數(shù)組，把char數(shù)組的每一個元素按16進制輸出。

在Android 7.1.2的測試機上，native層輸出的結果為[f0, 9f, 92, 8b] ，與Java的byte數(shù)組是一樣的，但是在Android 4.4.4的測試機上，輸出結果為[ed, a0, bd, ed, b2, 8b] 。從而導致加密后的結果不一樣。

服務端收到舊版Android的數(shù)據(jù)解密后得到[ed, a0, bd, ed, b2, 8b] ，計算MD5自然無法與[f0, 9f, 92, 8b]計算MD5一樣。

Unicode、UTF-8、UTF-16

可能有人不是很清楚上面那2種byte數(shù)組是怎么來的。首先我們要知道，UTF-8和UTF-16都是Unicode的實現(xiàn)。\uD83D\uDC8B其實是UTF-16大端的表現(xiàn)形式，對于大于0xFFFF（0x10000~0x10FFFF）的Unicode，轉(zhuǎn)換為UTF-16的步驟如下：

將Unicode減去0x10000，結果將是一個長度為20bit的值。將第一步的20bit的高10bit與0xD800進行或運算，得到UTF-16的高位代理。將第一步的20bit的低10bit與0xDC00進行或運算，得到UTF-16的低位代理。高位代理+低位代理即Unicode對應的UTF-16的大端形式。

按照這個步驟反推：

\uD83D\uDC8B的二進制位1101 1000 0011 1101 1101 1100 1000 1011，則高位代理為1101 1000 0011 1101，低位代理為1101 1100 1000 1011。高位代理由高10bit與0xD800進行或運算得到，因此高10bit為00 0011 1101。低位代理由低10bit與0xDC00進行或運算得到，因此低10bit為00 1000 1011。所有20bit的值為0000 1111 0100 1000 1011。加上0x10000，為0001 1111 0100 1000 1011，即0x1F48B。

所以，表情?對應的Unicode為0x1F48B。

UTF-8的規(guī)則是，對于占N個字節(jié)的符號（N>1)，第一個字節(jié)前N位都是1，N+1位是0，后面的字節(jié)前2位為10，然后把Unicode的二進制位填入空缺的二進制位中，空出的位置補0。因此，上面的Unicode 0x1F48B轉(zhuǎn)為UTF-8需要占4個字節(jié)，為：

11110 00010 01111110 01001010 001011

即0xF09F928B，這也就是[f0, 9f, 92, 8b]這個byte數(shù)組的由來。

那么[ed, a0, bd, ed, b2, 8b]這個byte數(shù)組又是怎么來的呢？這是把\uD83D\uDC8B當成2個單獨的字符處理了，按照上面Unicode轉(zhuǎn)UTF-8的邏輯，Unicode 0xD83D轉(zhuǎn)為UTF-8為1110 1101 10 100000 10 111101，即0xEDA0BD，Unicode 0xDC8B轉(zhuǎn)為UTF-8為1110 1101 10 110010 10 001011，即0xEDB28B。

關于Emoji表情在AndroidJNI中的兼容性問題分析是怎樣的就分享到這里啦，希望上述內(nèi)容能夠讓大家有所提升。如果想要學習更多知識，請大家多多留意小編的更新。謝謝大家關注一下創(chuàng)新互聯(lián)網(wǎng)站！

文章名稱：Emoji表情在AndroidJNI中的兼容性問題分析是怎樣的
網(wǎng)站網(wǎng)址：http://m.rwnh.cn/article8/jcgpip.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián)，為您提供、企業(yè)建站、網(wǎng)站收錄、定制開發(fā)、企業(yè)網(wǎng)站制作、網(wǎng)站建設

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

内射老阿姨1区2区3区4区_久久精品人人做人人爽电影蜜月_久久国产精品亚洲77777_99精品又大又爽又粗少妇毛片

Emoji表情在AndroidJNI中的兼容性問題分析是怎樣的