char[] 和 String 類型占用字節(jié)大小問(wèn)題

2019-8-8    seo達(dá)人

如果您想訂閱本博客內(nèi)容,每天自動(dòng)發(fā)到您的郵箱中, 請(qǐng)點(diǎn)這里

在 C 語(yǔ)言中
1、char a[10] = {"China"} 中,這個(gè) a 占用多少字節(jié)?

答:占用 10 個(gè)字節(jié)。

解析:上面代碼對(duì) a 做了賦值的操作,

a[0]='C' ,a[1]='h' ,a[2]='i' ,a[3]='n' ,a[4]='a' ,a[5]='\0',a[6]='\0',a[7]='\0',a[8]='\0',a[9]='\0'

所以,它占用的是 10 個(gè)字節(jié)。

2、如果單指 ”China“ ?

答:共 6 個(gè)字節(jié)。China 占 5 個(gè)字節(jié),最后以 '\0' 結(jié)束,占 1 個(gè)字節(jié)。

在 Java 語(yǔ)言中
1、String s = "China"; 占多少字節(jié)?

答:占 5 個(gè)字節(jié)。

System.out.println(Charset.defaultCharset());//獲取ide默認(rèn)編碼類型
String s = new String("China".getBytes());
byte[] b = s.getBytes();
System.out.println("" + b.length);
 以上代碼,可以輸出 "China" 所占的字節(jié)長(zhǎng)度為 5

2、String s = "中國(guó)"; 占多少字節(jié)?

答:如果是 漢字 的情況需要考慮編碼。

(1)GBK 編碼(ide默認(rèn))時(shí),每一個(gè)漢字占用 2 個(gè)字節(jié),那么中國(guó)占 4 個(gè)字節(jié)。

(2)UTF-8 編碼時(shí),每一個(gè)漢字占用 3 個(gè)字節(jié),那么中國(guó)占用 6 個(gè)字節(jié)。

3、轉(zhuǎn)碼問(wèn)題,GBK 轉(zhuǎn) UTF-8 時(shí),字節(jié)占用會(huì)變大嗎?反過(guò)來(lái)呢?

//獲取的是 UTF-8編碼
System.out.println(Charset.defaultCharset());
String s;
try {
        s = new String("中國(guó)".getBytes(),"GBK");
        byte[] b = s.getBytes();
        System.out.println("" + b.length);
    } catch (UnsupportedEncodingException e) {
        e.printStackTrace();
}
如上代碼是:UTF-8 轉(zhuǎn) GBK 編碼格式,s 長(zhǎng)度從 6 字節(jié)變?yōu)?9 字節(jié)。
s 內(nèi)容變化:中國(guó) —> 涓浗
因?yàn)楫?dāng)前編碼是 UTF-8,轉(zhuǎn)碼之后變成了 3 個(gè)文字,占用 9 個(gè)字節(jié)。然而,反過(guò)來(lái)的情況是這樣的:

中國(guó) (gbk) —> ?й? (utf-8)
s 長(zhǎng)度從 4字節(jié) 變成了 4字節(jié),雖然長(zhǎng)度沒(méi)發(fā)生改變,但是文字已經(jīng)改變。這里的 ? 占用 1 個(gè)字節(jié)。

藍(lán)藍(lán)設(shè)計(jì)sillybuy.com )是一家專注而深入的界面設(shè)計(jì)公司,為期望卓越的國(guó)內(nèi)外企業(yè)提供卓越的UI界面設(shè)計(jì)、BS界面設(shè)計(jì) 、 cs界面設(shè)計(jì) 、 ipad界面設(shè)計(jì) 、 包裝設(shè)計(jì) 、 圖標(biāo)定制 、 用戶體驗(yàn) 、交互設(shè)計(jì)、 網(wǎng)站建設(shè) 、平面設(shè)計(jì)服務(wù)

分享本文至:

日歷

鏈接

個(gè)人資料

存檔