一、概述
1.
英文字母再加一些其他標(biāo)點字符之類的也不會超過256個,用一個字節(jié)來表示一個字符就足夠了(2^8 = 256)。但其他一些文字不止這么多字符,比如中文中的漢字就多達(dá)10多萬個,一個字節(jié)只能表示256個字符,肯定是不夠的,因此只能使用多個字節(jié)來表示一個字符。
于是當(dāng)計算機被引入到中國后,相關(guān)部門設(shè)計了GB系列編碼(“GB”為“國標(biāo)”的漢語拼音首字母縮寫,即“國家標(biāo)準(zhǔn)”之意)。
按照GB系列編碼,在一段文本中,如果一個字節(jié)是0~127,那么這個字節(jié)的含義同ASCII編碼,否則,這個字節(jié)和下一個字節(jié)共同組成漢字(或是GB編碼定義的其他字符)。
因此,GB系列編碼向下兼容ASCII,也就是說,如果一段用GB編碼文本里的所有字符都在ASCII中有定義(即該文本全部由ASCII字符組成),那么這段編碼和ASCII編碼完全一樣。
2.
GB編碼早期收錄的漢字不足一萬個,基本能滿足日常使用需求,但不包含一些生僻字,因此后來又進(jìn)行了擴展。