分類導(dǎo)航

刨根究底字符編碼之十三——UTF-16編碼方式

發(fā)布時(shí)間：2017年06月17日作者：IT網(wǎng)絡(luò)文摘

UTF-16編碼方式

UTF-16編碼方式源于UCS-2(Universal Character Set coded in 2 octets、2-byte Universal Character Set)。而UCS-2，是早期遺留下來(lái)的歷史產(chǎn)物。

UCS-2將字符編號(hào)直接映射為字符編碼(CEF，而非CES，詳見(jiàn)前文中對(duì)現(xiàn)代字符編碼模型的解釋)，亦即字符編號(hào)就是字符編碼，中間沒(méi)有經(jīng)過(guò)特別的編碼算法轉(zhuǎn)換。因此，從現(xiàn)代字符編碼模型的角度來(lái)看的話，此時(shí)并沒(méi)有將編號(hào)字符集CCS與字符編碼方式CEF作嚴(yán)格區(qū)分，既可以將UCS-2看作是編號(hào)字符集CCS中的字符編號(hào)，也可以看作是字符編碼方式CEF中的字符編碼。

后來(lái)，隨著Unicode聯(lián)盟與ISO/IEC就創(chuàng)建全球統(tǒng)一的單一通用字符集進(jìn)行合作，Unicode字符集與UCS字符集逐漸相互融合，兩者最終基本保持了一致（詳見(jiàn)前文《刨根究底字符編碼之八——Unicode編碼方案概述》中的介紹）。

（笨笨阿林原創(chuàng)文章

分類導(dǎo)航

刨根究底字符編碼之十三——UTF-16編碼方式

UTF-16編碼方式

網(wǎng)友評(píng)論

更多精彩分享