分類導(dǎo)航

Java Unicode編碼及 Mysql utf8 utf8mb3 utf8mb4 的區(qū)別與utf8mb4的過濾

發(fā)布時間：2017年03月27日作者：文章轉(zhuǎn)自網(wǎng)絡(luò)，版權(quán)歸原作者所有，反饋可立刻刪除 (該文來自筆記，點(diǎn)擊查看原文)

內(nèi)容簡介

本文主要介紹了UTF8的一些基本概念，簡要介紹了mysql中 utf8 utf8mb3 utf8mb4 的區(qū)別；然后為介紹Java對Unicode編碼的支持，引入了一些編碼的基本概念，包括code point， code unit等，并介紹了Java提供的常用的支持Unicode編碼的方法；最后給出了過濾UTF8mb4的方案

UTF-8簡介

UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字符編碼，也是一種前綴碼。它可以用來表示Unicode標(biāo)準(zhǔn)中的任何字符，且其編碼中的第一個字節(jié)仍與ASCII兼容，這使得原來處理ASCII字符的軟件無須或只須做少部分修改，即可繼續(xù)使用。因此，它逐漸成為電子郵件、網(wǎng)頁及其他存儲或發(fā)送文字的應(yīng)用中，優(yōu)先采用的編碼。

UTF-8使用一至四個字節(jié)為每個字符編碼（2003年11月UTF-8被RFC 3629重新規(guī)范，只能使用原來Unicode定義的區(qū)域，U+0000到U+10FFFF，也就是說最多四個字節(jié)）：

128個US-ASCII字符只需一個字節(jié)編碼（Unicode范圍由U+0000至U+007F）。
帶有附加符號的拉丁文、希臘文、西里爾字母、亞美尼亞語、希伯來文、阿拉伯文、敘利亞文及它拿字母則需要兩個字節(jié)編碼（Unicode范圍由U+0080至U+07FF）。
其他基本多文種平面（BMP, Basic Multilingual Plane）中的字符（這包含了大部分常用字，例如CJVK常用字字符集 —— Chinese, Japanese, Vietnam, Korean）使用三個字節(jié)編碼（Unicode范圍由U+0800至U+FFFF）。
其他使用極少的Unicode 輔助平面（Supplementary Multilingual Plane）的字符使用四字節(jié)編碼（Unicode范圍由U+10000至U+10FFFF，主要包括不常用的CJK字符, 數(shù)學(xué)符號, emoji表情等）。

utf-8編碼方式
大數(shù)據(jù)培訓(xùn),云培訓(xùn),數(shù)據(jù)挖掘培訓(xùn),云計算培訓(xùn),高端軟件開發(fā)培訓(xùn),項目經(jīng)理培訓(xùn)

unicode code point table
大數(shù)據(jù)培訓(xùn),云培訓(xùn),數(shù)據(jù)挖掘培訓(xùn),云計算培訓(xùn),高端軟件開發(fā)培訓(xùn),項目經(jīng)理培訓(xùn)

參考與擴(kuò)展：
維基百科 UTF-8 https://en.wikipedia.org/w

延伸閱讀

 ssh框架 2016-09-30

阿里移動安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍(lán)牙鎖 2017-07-26

消息隊列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26

Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26

詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26

從棧不平衡問題理解 calling convention 2017-07-26

php imagemagick 處理圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26

Swift實現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26

阿里移動安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26

集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26

學(xué)習(xí)是年輕人改變自己的最好方式

我想了解如何學(xué)習(xí)

姓名：

手機(jī)：

留言：

16年我們追求卓越 24項主流技術(shù)引領(lǐng)先鋒 1000課時打造職場干將 50000行代碼練就非凡本領(lǐng)

關(guān)于萬碼學(xué)堂

校園環(huán)境

聯(lián)系我們

網(wǎng)站地圖

關(guān)于學(xué)習(xí)

課程體系

關(guān)于萬碼

課程體系

報名方法

申請試聽

在線報名

常見問題

大家關(guān)注

在線提問

學(xué)習(xí)方面

關(guān)注我們

新浪微博

聯(lián)系我們

聯(lián)系微信

0532-85025005

馬上咨詢，周一至周日8:00-18:00

在線客服

萬碼學(xué)員實訓(xùn)作品

IT企業(yè)招聘信息

在萬碼學(xué)堂奮斗的歲月

編程知識分享

你想了解的萬碼學(xué)堂

青島軟件培訓(xùn)課程

IT行業(yè)動態(tài)

職場人生

學(xué)習(xí)編程的感想

萬碼學(xué)員風(fēng)采

萬碼學(xué)堂技術(shù)專家

欄目導(dǎo)航：如何學(xué)習(xí)軟件關(guān)于萬碼學(xué)堂開班信息關(guān)注點(diǎn)

旗下網(wǎng)站：青島IT培訓(xùn)網(wǎng) 程序猿編程派青島電腦學(xué)校青島Android培訓(xùn) 青島軟件培訓(xùn) 云培訓(xùn) 萬碼學(xué)堂官網(wǎng) 青島大學(xué)生IT培訓(xùn)

青島青軟職業(yè)培訓(xùn)學(xué)校萬碼學(xué)堂（辦學(xué)許可證編號：人社民3702023080012號）魯ICP備09077726號 qingruanit.net

青島市市南區(qū)南京路122號B1棟3層咨詢電話0532-85025005

感谢您访问我们的网站，您可能还对以下资源感兴趣：
国产一卡2卡三卡4卡

分類導(dǎo)航

Java Unicode編碼 及 Mysql utf8 utf8mb3 utf8mb4 的區(qū)別與utf8mb4的過濾

內(nèi)容簡介

UTF-8簡介

延伸閱讀

我想了解如何學(xué)習(xí)

Java Unicode編碼及 Mysql utf8 utf8mb3 utf8mb4 的區(qū)別與utf8mb4的過濾