UTF-16編碼方式
1.
UTF-16編碼方式源于UCS-2(Universal Character Set coded in 2 octets、2-byte Universal Character Set)。而UCS-2,是早期遺留下來(lái)的歷史產(chǎn)物。
UCS-2將字符編號(hào)直接映射為字符編碼(CEF,而非CES,詳見前文中對(duì)現(xiàn)代字符編碼模型的解釋),亦即字符編號(hào)就是字符編碼,中間沒(méi)有經(jīng)過(guò)特別的編碼算法轉(zhuǎn)換。因此,從現(xiàn)代字符編碼模型的角度來(lái)看的話,此時(shí)并沒(méi)有將編號(hào)字符集CCS與字符編碼方式CEF作嚴(yán)格區(qū)分,既可以將UCS-2看作是編號(hào)字符集CCS中的字符編號(hào),也可以看作是字符編碼方式CEF中的字符編碼。
后來(lái),隨著Unicode聯(lián)盟與ISO/IEC就創(chuàng)建全球統(tǒng)一的單一通用字符集進(jìn)行合作,Unicode字符集與UCS字符集逐漸相互融合,兩者最終基本保持了一致(詳見前文《刨根究底字符編碼之八——Unicode編碼方案概述》中的介紹)。