分類(lèi)導(dǎo)航

字符集編碼與Python（二）Unicode與utf-8

發(fā)布時(shí)間：2017年02月05日作者：文章轉(zhuǎn)自網(wǎng)絡(luò)，版權(quán)歸原作者所有，反饋可立刻刪除 (該文來(lái)自筆記，點(diǎn)擊查看原文)

Python中的Unicode和utf-8

上一篇提過(guò)了字符集的歷史其中簡(jiǎn)單的講解了Unicode與utf-8的關(guān)系，簡(jiǎn)單的總結(jié)一下：

utf-8和utf-16 、utf-32是一類(lèi)，實(shí)現(xiàn)的功能是一樣的，只是utf-8使用的最為廣泛，但是Unicode和utf-8并不是同一類(lèi)，Unicode是表現(xiàn)形式，utf-8是存儲(chǔ)形式

unicode是表現(xiàn)形式（utf-8可以解碼成unicode）
utf-8 、utf-16 、utf-32 是存儲(chǔ)形式（unicode可以編碼成utf-8）

理解：存儲(chǔ)的時(shí)候需要編碼成utf-8，表現(xiàn)的時(shí)候是一個(gè)utf-8需要解碼成為Unicode，換句話(huà)說(shuō)，在代碼中處理的是Unicode，在文件中存儲(chǔ)的時(shí)候是以u(píng)tf-8的形式存儲(chǔ)。

不使用Unicode的形式

In [1]: name = '張三'
 In [2]: print name     
張三
 
In [3]: name
Out[3]: '\xe5\xbc\xa0\xe4\xb8\x89'     #utf8編碼，存儲(chǔ)形式 In [4]: len(name)
Out[4]: 6
 In&n
        
        	
        		延伸閱讀
        		
        			
        			ssh框架
        			2016-09-30
        			
        			
        			
        			阿里移動(dòng)安全 [無(wú)線(xiàn)安全]玩轉(zhuǎn)無(wú)線(xiàn)電——不安全的藍(lán)牙鎖
        			2017-07-26
        			
        			
        			
        			消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe
        			2024-03-26
        			
        			
        			
        			Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】
        			2017-07-26
        			
        			
        			
        			詞向量-LRWE模型-更好地識(shí)別反義詞同義詞
        			2017-07-26
        			
        			
        			
        			從棧不平衡問(wèn)題 理解 calling convention
        			2017-07-26
        			
        			
        			
        			php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明
        			2017-07-26
        			
        			
        			
        			Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解
        			2017-07-26
        			
        			
        			
        			阿里移動(dòng)安全 Android端惡意鎖屏勒索應(yīng)用分析
        			2017-07-26
        			
        			
        			
        			集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來(lái)看看(二)
        			2017-07-26
        			
        			
        			
        		
        		
        		學(xué)習(xí)是年輕人改變自己的最好方式

我想了解如何學(xué)習(xí)

分類(lèi)導(dǎo)航

字符集編碼與Python（二）Unicode與utf-8

Python中的Unicode和utf-8

不使用Unicode的形式

延伸閱讀

我想了解如何學(xué)習(xí)