日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > c/c++ >内容正文

c/c++

c++ string 长度限制_String 有多长?

發布時間:2024/9/30 c/c++ 45 豆豆
生活随笔 收集整理的這篇文章主要介紹了 c++ string 长度限制_String 有多长? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1 String的形式

public final class String

String類是由final修飾的,所以是不能被繼承的①,我們在對字符串進行比較時,一般是期望對比其中的字符串是否一樣,所以這里我們不能用"=="進行字符串的比較,而是需要使用"equals"方法②,因為使用==進行比較時,是比較的對象,只有指向同一個字符串對象的才會是true,否則就算字符串值相同也可能出現不相等的情況。

private final char value;

String的值實際上是以char的數組存儲的,并且是final的,所以字符串對象是不可變的③,但是我們可以看到字符串的一些操作會誤導我們,比如使用:

String a = "aaaa";a += "bbbb";

其實這個時候a已經指向新的對象地址。

到這里為止,初級工程師都應該很熟悉。

2 String的形式

在思考String能有多長之前,我們先看下String定義的不同形式。

// 第一種String s = "aaaaaaaaaaaaa...";// 第二種byte a = readFromFile(new File("someLargeText.txt"));String superLongString = new String(a);

那么既然思考String的長度,那就應該想想為什么會有長度的限制,難道我在編譯器里定義一個String時,有多長不是隨便我們自己輸入嗎?還有上面兩種方式有什么區別呢?

2.1 字面量的形式

對于第一種是字面量,Java將其存在常量池中,在Java1.6的版本中是在棧的常量池中,在1.7、1.8版本中將其放到了堆的常量池中。那就是說第一種這種方式中是受到常量池大小的約束了,不錯,是會受到常量池的約束,但是在運行在JVM之前,被編譯成字節碼時就已經有了限制。

如上圖所示,編譯后的length的類型為u2(無符號16位),也就是講length的最大值為2^16-1 = 65535,那就是講我們的上面的字符串s長度按MUTF-8(字節碼中的編碼)編碼可以存儲65535個字節。

到這里為止,如果你是中級工程師,知道這么多已經很不錯了。

可是事實上呢,我們實驗后發現只能存儲65534個字節,這是為什么呢?網上有很多猜想,大部分不正確。我們扒一下Java編譯器的源碼,會發現:

這下大家明白了吧,Java編譯器在檢查字符串常量時,判斷的是長度只有<65535才會正常,否則報錯。看起來像是編譯器的Bug。如果你會修改編譯器源碼,你將上面的判斷條件改成<=65535,這樣你存一個65535個字符"a"的字符串就不會編譯出錯了。

我們知道上面我們是用拉丁字符"a"來測試的,a使用UTF-8編碼剛好是一個字節,所以可以存儲65534個,那如果存漢字呢,比如我們經常看到的"燙",它使用TF-8編碼后占用三個字節,那么也就是說我們可以這樣定義:

// 按照我們剛才的分析,應該可以存儲65534/3個"燙"漢字String s = "燙燙燙...燙燙";

那我們嘗試存儲65535/3個漢字"燙"試試呢?結果是可以的,并沒有報錯。誒?這是為什么呢?我們繼續扒下編譯器的源碼看到:

編譯處理漢字這種的呢,他判斷的邏輯不一樣。條件是>65535才會拋異常,也就是小于等于65535是正常的。很有意思,寫Java編譯器的人也很有意思哈。

2.1 new的形式

對于第二種形式的,很顯然只有在運行時受限于Java虛擬機了。我們知道String最后保存在char數組中,Java虛擬機是如何做的呢?簡單參考下源碼:

虛擬機指令newarray [int],size是以整形定義的,所以它的限制其實就是int的最大值,但是在有一些虛擬機上會保留一些頭信息在數組中,所以就變成了Integer.MAX_VALUE - 8個char;

到這里呢,基本上你就有了高級工程師的思考高度了。

3

總結

3.1 字面量的形式

  • 受字節碼數據結構的限制,字符串使用MUTF-8編碼后字節數不超過65535

  • 拉丁字符,受Java編譯器代碼限制,最多只能存儲65534個字節

  • 非拉丁字符,最多存儲65535個字節

3.2 new的形式

  • 受虛擬機指令限制,字符數理論上線是Integer.MAX_VALUE,但是實際上有保留頭信息的部分,所以會略小

  • 受堆內存的限制,如果堆內存很小,那就不能超過堆內存的限制

看起來本文有點過于追求細節了,有點孔乙己的回字有幾種寫法的意思。實際則不然,搞技術就是要把握好細節,才能寫出優秀的代碼,才能成為高階的工程師而不是碼農。

如果看到這里,說明你喜歡這篇文章,請轉發

總結

以上是生活随笔為你收集整理的c++ string 长度限制_String 有多长?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。