當前位置：首頁 > 编程语言 > c/c++ >内容正文

c/c++

【C/C++ 汇编语言 Verilog】越界截断——数据越界问题的多角度分析

發(fā)布時間：2023/11/30 c/c++ 36 豆豆

生活随笔收集整理的這篇文章主要介紹了【C/C++ 汇编语言 Verilog】越界截断——数据越界问题的多角度分析小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

0 前言

0.1 討論層級和范圍

討論層級
- 計算機底層：硬件層次與匯編指令層次
- 信息與二進制位
討論范圍
- 信息的存儲與運算在匯編語言與Verilog HDL中的聯(lián)系與區(qū)別
- 事實上，數(shù)據(jù)越界截斷問題，在計算機體系的任何層次，都可能發(fā)生，并且他們遵循的法則基本是一致的

0.2 其他說明

信息與數(shù)據(jù)，本質(zhì)上來講沒有區(qū)別，信息就是數(shù)據(jù)，數(shù)據(jù)就是信息。為方便起見，在本文中，全部都稱數(shù)據(jù)。
數(shù)據(jù)越界問題的分析，在實際應(yīng)用中有以下用途
- 在一開始設(shè)計的時候避免越界問題的發(fā)生
- 在發(fā)生錯誤的時候有能力分析出其原因

1 一個概念

越界丟失法則：超過存儲能力的數(shù)據(jù)，會被截斷，從而導(dǎo)致丟失，也可以稱為越界截斷。

這就好比，一個水桶一旦裝滿水，再灌水會溢出來，溢出的水就是丟失了

1.1 越界截斷

我們知道，數(shù)據(jù)在計算機中是以二進制信息存儲的，即一串一串的二進制數(shù)

01011101

0	1	1	1	1	0	0	0
…

對于上圖所示的，是兩個8位的二進制位串。

下面將通過演示說明，什么是越界截斷，對于8個二進制位來說，所能表示的最大數(shù)據(jù)就是8位全部是1：

11111111

如果再給這個數(shù)值加1，那么就會數(shù)值就變成：

100000000

這是9位二進制數(shù)，但實際上計算機只能存儲8位，因此超過其所能承受的范圍，最高位的1將會被截斷，從而造成數(shù)據(jù)丟失：

被截斷00000000

也就變成了：

00000000

這就是數(shù)據(jù)的越界截斷。

有些讀者可能會誤以為越界丟失就是歸零，因此我再舉一個例子，以消除誤解。

對于8個二進制位來說，如果給他施加了達到10個二進制位的數(shù)字：

1100101010

那么它的最高兩位將會丟失

被截斷00101010

也就變成了：

00101010

1.2 越界截斷建模——水溢出模型

數(shù)據(jù)的越界丟失，就好比水桶滿了，多出的水會溢出，但是水桶的水并不會消失，只是多出來的水丟失了。

1.3 補充概念——溢出

當數(shù)據(jù)發(fā)生越界，超出了容器容納范圍時，我們稱發(fā)生了溢出

2 兩個方向

對于越界截斷現(xiàn)象，有兩個考慮的方向。

2.1 數(shù)據(jù)的存儲——水桶儲水模型

信息的存儲是指，將信息直接存儲起來
就好比將水放進水桶中

2.2 數(shù)據(jù)的運算——水處理模型

信息的運算是指，對傳輸過來的數(shù)據(jù)，進行運算（加、減、乘、除……），也就是數(shù)據(jù)的處理過程
就好比污水經(jīng)過處理廠變成了凈水

亦或者是一桶水倒入另外一桶水中，這樣的模型都是合理的，能夠幫助你理解這一過程

3 三個過程

對于越界截斷現(xiàn)象，一般會發(fā)生在三個過程中。

3.1 初始量：設(shè)初值

包含數(shù)據(jù)類型、標識符的設(shè)定，以及賦初值的過程

3.1.1 Verilog

在Verilog語言中，初始化的方式如下

reg a = 1'b1; reg b = 123; reg c; c = 1'b0;

對于a和c來說，一個二進制位存儲一個二進制數(shù)，這是標準的
對于b來說，顯然數(shù)據(jù)越界了，Verilog會執(zhí)行越界丟失操作，留下沒越界的數(shù)字
- 123用二進制表示是：0111_1011
- 因此留下最后一位1，其余高位全部丟失

3.1.2 匯編語言

以8086CPU中16位寄存器AX為例，說明數(shù)據(jù)的初始化問題

mov AX,11H // ① mov AX,1000001H // ②

對于①，將它顯然正確
對于②，明顯越界，這是錯誤的指令，注意，是錯誤，可能不會被容錯直接報錯

3.1.3 C/C++等高級語言

int a = 1000100010000; int b = 100;

很明顯，a越界了，b是正確的

越界是錯誤的！

問題：為什么會顯示右側(cè)這一串數(shù)字？C++是怎么運行出來的？
在回答這個問題之前，先來學(xué)習(xí)一下延展知識。

3.1.3.1 延展閱讀1：VS C++ 的內(nèi)存查看方法

【VS C++ 2010】查看內(nèi)存的方法詳解

學(xué)習(xí)完之后，再繼續(xù)往下進行

以下面的代碼為示例：

int main() {int a = 100;int b = 100010001000;cout << "a = " << a << " " << &a << endl;cout << "b = " << b << " " << &b << endl;system("pause");return 0; }

以下，我們都需要使用剛剛學(xué)到的知識，查看內(nèi)存的情況

（1）對于正數(shù)

①不越界的正數(shù)

對于int a = 100;，顯然是不越界的，其內(nèi)存情況為

這一點沒什么好說的

a的類型為int
數(shù)值為100（十進制），被解釋為數(shù)字100
存儲為二進制位串
顯示為0x64（十六進制的64）

②越界的正數(shù)

對于十進制數(shù)據(jù) 1000_1000_1000，其十六進制為：17 49 0F 82 68

17490F8268

由越界截斷可得，被保留下來的為：49 0F 82 68

被截斷490F8268

我們查看內(nèi)存來驗證一下

內(nèi)存上的存儲的確是這樣，將其換算為十進制，就是我們的輸出結(jié)果了

（2）對于負數(shù)的越界

3.1.3.2 延展閱讀2：補碼的使用

補碼轉(zhuǎn)換人工求法【非常沒必要，計算機要做的事情為什么要人來做？不過做考試題還是有必要的……】：

求負數(shù)絕對值的原碼后減一【這個減一就很蠢，補碼的使用就是為了避免減法，你居然用減法來避免減法……，但是做考試題確實比用反碼的方法更快】

對上述結(jié)果全部取反

對于負數(shù)，計算機以補碼形式來存儲的本質(zhì)

對于負數(shù)：

計算機先將其轉(zhuǎn)換為補碼形式

再進行存儲，如果越界，則會發(fā)送越界截斷

①不越界的負數(shù)

直接以補碼形式存儲

②越界的負數(shù)

先存儲為補碼，然后越界截斷，然后再存儲起來

3.1.4 小結(jié)

我通過三種語言的描述，來為你傳到這樣的信號：

不同語言對于越界問題的處理方式是不同的，這是顯而易見的，他們所處的計算機系統(tǒng)層次不一樣，抽象程度也不一樣
毫無疑問，在賦初值的時候就造成越界，這是設(shè)計的失敗，這是不可容忍的錯誤

總之，不要越界（后面的小節(jié)會講解它也是雙刃劍，可以**“變廢為寶”**）

3.1.4.1 延展閱讀3：在邊界內(nèi)做事情

待完善部分，敬請期待

3.1.4.2 優(yōu)化模型——水桶的水不能溢出

對于水桶儲水模型，請回看2.1節(jié)的內(nèi)容，這里通過幾張圖來展示幾種可能的情況

3.1.4.3 一句話總結(jié)：做事不能越界

3.2 過程量：做運算

對于運算之后造成的越界問題，參考3.1.3節(jié)中的問題部分的解答即可

3.2.1 數(shù)學(xué)運算（加減乘除……）

不管是高級語言，還是匯編語言，在進行數(shù)學(xué)運算的時候都可能產(chǎn)生越界的問題——兩個數(shù)字都沒有越界，但是相加之后越界了

設(shè)計者一定要考慮并且避免這些問題的發(fā)生，否則可能會引發(fā)錯誤。

3.2.2 數(shù)據(jù)類型的強制轉(zhuǎn)換

3.2.2.1 手動強制轉(zhuǎn)換

數(shù)據(jù)的強制轉(zhuǎn)換也可能引發(fā)錯誤，比如：在java中，將int類型的數(shù)字轉(zhuǎn)換為byte類型，由高向低轉(zhuǎn)換，就可能引起數(shù)據(jù)的丟失。

例如下列Java代碼

int a = 300; byte b = (byte)a; System.out.println(b);

輸出為：

原因分析：
對于原數(shù)字，被保存為0x12C（十六進制前綴為“0x”），強制轉(zhuǎn)換為byte類型，則會發(fā)生越界截斷，將最高位的1截斷，變成了0x2C，也就是十進制的44

3.2.2.2 自動強制轉(zhuǎn)換

另外，在C/C++、Java中，有一類二元運算符，比如

+=
-=
*=
/=
例如x += y，它的本質(zhì)是x = x + y，由于y的數(shù)據(jù)類型并不確定，因此可能會產(chǎn)生錯誤，比如：

int x = 3; x = x + 3.5;

這是不被允許的，x + 3.5是float類型，不能直接賦值給int類型，這時候需要進行強制轉(zhuǎn)換x = (int)(x + 3.5)，得到的結(jié)果是6

對于上述二元運算符來說，這個強制轉(zhuǎn)換是自動進行的

int x = 20; x += 3.5;

對于第二條語句，并不等價于x = x + 3.5而是等價于x = (int)(x + 3.5)

3.3 結(jié)束量：得結(jié)果

3.3.1 直接輸出

對于得到的結(jié)果，直接輸出，那么就是越界丟失之后的結(jié)果，沒什么好說的。

如果直接在輸出函數(shù)的參數(shù)內(nèi)進行運算，那么越界與否取決于實際的環(huán)境，看情況而定，數(shù)據(jù)的結(jié)果一定要在范圍內(nèi)！。

3.3.2 結(jié)果被保存到其他變量中

如果運算得到的結(jié)果被保存到了其他變量中，如果將大的數(shù)據(jù)，保存到小容器中，顯然會越界

4 雙刃劍——越界截斷的利弊分析

4.1 避開弊端

從專業(yè)詞語來說，越界丟失更適合稱為越界截斷，越界的部分將會被計算機截斷，從而造成了丟失。

毫無疑問，數(shù)據(jù)的丟失是可怕的，因此，大多數(shù)情況下，尤其是程序員，要盡可能的避免發(fā)生越界截斷。

4.2 壞事變好：應(yīng)用越界截斷——補碼的使用

從哲學(xué)的角度來說，任何事情都有兩面性，如果我們利用好越界截斷，也能讓它發(fā)揮巨大的作用。

計算機有加法器，但是它不擅長減法，于是

補碼+越界截斷

就完成了減法轉(zhuǎn)換為加法這一壯舉！

例如：45 + （-22） = 23
在計算機中，以補碼形式存儲，用補碼進行加減
45的補碼：

00101101

-22的補碼：

11101010

補碼相加：

100010111

發(fā)生越界截斷：

被截斷00010111

得到：

00010111

也就是23的補碼

**但是，務(wù)必注意：**使用補碼進行運算，運算結(jié)果也一定要在范圍內(nèi)，否則依然是錯誤。

5 注意事項：先確定正確的界限，才能分析越界截斷

比如下面這個例子，如果你把它的界限弄錯，那么你可能會得到錯誤的結(jié)果。

char a = 100; char b = 28; char c = a+b; cout << dec << (int)c << endl;unsigned char d = a+b; cout << dec << (int)d << endl;

會輸出

顯然，a+b并不會越界

10000000

但是，同樣是char類型，一個是有符號數(shù)，一個是無符號數(shù)，輸出的結(jié)果卻不一樣。

這是因為

對于有符號數(shù)來說，它的界限的7位，因為要除去符號位
對于無符號數(shù)來說，它的界限是8位，不需要除去符號位

說到這里，你也就明白，數(shù)據(jù)的界限是討論越界截斷的前提。

因此設(shè)計者要綜合考慮很多問題，這也是計算機科學(xué)家的基本素養(yǎng)。

6 綜合闡述

任何計算機程序都是由各種數(shù)據(jù)構(gòu)成的
各種數(shù)據(jù)又擁有不同的數(shù)據(jù)類型

因此：數(shù)據(jù)只要在對應(yīng)數(shù)據(jù)類型的范圍內(nèi)，就不會發(fā)生錯誤。

最終結(jié)果就是，保證數(shù)據(jù)在數(shù)據(jù)類型的范圍內(nèi)運行即可，對于補碼運算而言，中間過程發(fā)生越界是沒有問題的，但是結(jié)果不能越界，上面一大堆分析完全可以不用看（不要打我……分析有助于你未來思考更深入的問題，光記住結(jié)論是走不遠的）。

7 延展閱讀匯總

待補充

總結(jié)

以上是生活随笔為你收集整理的【C/C++ 汇编语言 Verilog】越界截断——数据越界问题的多角度分析的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。