分類導(dǎo)航

刨根究底字符編碼之十二——UTF-8究竟是怎么編碼的

發(fā)布時間：2017年06月07日作者： IT網(wǎng)絡(luò)文摘 (該文來自筆記，點擊查看原文)

UTF-8究竟是怎么編碼的

1.

UTF-8編碼是Unicode字符集的一種編碼方式(CEF)，其特點是使用變長字節(jié)數(shù)(即變長碼元序列、變寬碼元序列)來編碼。一般是1到4個字節(jié)，當(dāng)然，也可以更長。

為什么要變長呢？這可以理解為按需分配，比如一個字節(jié)足以容納所有的ASCII字符，那何必補一堆0用更多的字節(jié)來存儲呢？

實際上變長編碼有其優(yōu)勢也有其劣勢，優(yōu)勢是節(jié)省空間、自動糾錯性能好、利于傳輸、擴展性強，劣勢是不利于程序內(nèi)部處理，比如正則表達式檢索；而UTF-32這樣等長碼元序列(即等寬碼元序列)的編碼方式就比較適合程序處理，當(dāng)然，缺點是比較耗費存儲空間。

2.

那UTF-8究竟是怎么編碼的呢？也就是說其編碼算法是什么？

延伸閱讀

ssh框架 2016-09-30
阿里移動安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍牙鎖 2017-07-26
消息隊列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26
從棧不平衡問題理解 calling convention 2017-07-26
php imagemagick 處理圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
Swift實現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
阿里移動安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負責(zé)任的教育,學(xué)習(xí)改變命運,軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)

學(xué)習(xí)是年輕人改變自己的最好方式

我想了解如何學(xué)習(xí)

<mark id="yh9z4"></mark>