UTF-8 編碼方案 采用變長(zhǎng)編碼 1~N方案, 其中英文1個(gè)byte
中文3個(gè)byte
char[] = ['A','B','中']
utf8 = [41 42 e4 b8 ad]
utf-8: 是將unicode 編碼為 byte 序列的方案
中: 4e2d = 0100111000101101
e4 b8 ad = 11100100 10111000 10101101
1110XXXX 10XXXXXX 10XXXXXX
以0為開(kāi)頭的是 英文!(0~127)
110 表示連續(xù)2字節(jié)表示一個(gè)字符
1110 表示連續(xù)3字節(jié)表示一個(gè)字符
11110 表示連續(xù)4字節(jié)表示一個(gè)字符
每個(gè)數(shù)據(jù)字節(jié)以 10開(kāi)頭
全國(guó)職稱計(jì)算機(jī)考試速成過(guò)關(guān)系列套裝:W .. 定價(jià):¥133 優(yōu)惠價(jià):¥133.0 更多書(shū)籍 | |
全國(guó)職稱計(jì)算機(jī)考試速成過(guò)關(guān)系列套裝:W .. 定價(jià):¥124 優(yōu)惠價(jià):¥124.0 更多書(shū)籍 |