引言

我相信很多人在初接觸編程時,都被字符集狠狠地虐過,特別是數(shù)據(jù)庫的中文亂碼問題,那么亂碼是怎么產(chǎn)生的呢? 我們都知道計算機是以二進(jìn)制存儲和運行的,那么它是怎么把二進(jìn)制數(shù)據(jù)轉(zhuǎn)換為各種文字的呢? 還有我們常用的各種字符集,常用的編碼轉(zhuǎn)換,都是怎么進(jìn)行的呢?

本博文所寫的內(nèi)容不是技術(shù)干貨,只是對我們常用的字符集和編碼的一個小總結(jié),小科普。我相信讀完本文,您應(yīng)該對 字符集和常見編碼方式 有個差不多的認(rèn)識了。


ASCII碼

ASCII碼(American Standard Code for Information Interchange,美國信息交換標(biāo)準(zhǔn)代碼)應(yīng)該是我們最初接觸過的編碼方式了,編程最常用的字符都被它包括在內(nèi)。它使用7bit來表示 128(2e7)個字符,最高位固定為 0,共占用一個字節(jié)。其中:

  • 0~31 及 127(共33個)是控制字符或通信專用字符(其余為可顯示字符),如控制符:TAB(制表符)、CR(回車)、DEL(刪除)、BS(退格)等,常用的ASCII值為 8、9、10 和13 分別轉(zhuǎn)換為退格、制表、換行和回車字符。

  • 48~57 為 0 到 9 十個阿拉伯?dāng)?shù)字。

  • 65~90 為 26 個大寫英文字母,97~122 號為 26 個小寫英文字母,其余為一些標(biāo)點符號、運算符號等。

  • 32~47,58~64,123~126 代表常用標(biāo)點符號(:‘等);

網(wǎng)友評論