
在计算机中,当要表示的数据超出计算机所使用的数据的表示范围时,则产生数据的溢出,这种现象叫做数据溢出。
例如,一数据源不断发送数据,进入缓存区,再从缓存端口输出。但是若数据写入的速率大于数据读出的速率,那么缓存器迟早要被数据占满,若不采取一定措施(如暂停写入数据),那么数据就会溢出,这样会导致数据的丢失。
数据溢出的的原因
当应用程序读取用户(也可能是恶意攻击者)数据,试图复制到应用程序开辟的内存缓冲区中,却无法保证缓冲区的空间足够时(换言之,假设代码申请了N字节大小的内存缓冲区,随后又向其中复制超过N字节的数据),内存缓冲区就可能会溢出。
最重要的是,C/C++编译器开辟的内存缓冲区常常邻近重要的数据结构。假设某个函数的堆栈紧接在在内存缓冲区后面时,其中保存的函数返回地址就会与内存缓冲区相邻。
此时,恶意攻击者就可以向内存缓冲区复制大量数据,从而使得内存缓冲区溢出并覆盖原先保存于堆栈中的函数返回地址。这样,函数的返回地址就被攻击者换成了他指定的数值;一旦函数调用完毕,就会继续执行“函数返回地址”处的代码。
什么是溢出?
溢出,是指数据的大小,超出了编码所能表示的范围。
不仅是补码计算,任何形式的计算,都可能产生溢出。
比如:1999 年、2000 年 ...,这是用 4 位十进制表示。
当到了 9999 年,再过一年,你如果还用 4 位表示,就会溢出了。
如果不限制编码的位数,那就不存在溢出的问题。
-----------------------------
无符号数的溢出
计算机所能运算的位数是固定的,如:八位机、16、32、64 位机。
当字长为八位时,其计数范围是:0000 0000~1111 1111。
用它们表示十进制的【自然数】,就是:0~255。
在小学学过的【自然数】,在计算机专业中,改称为“无符号数”。
---------------
如果在其最大值(255)再加上一,就会超出表示范围,发生溢出。
此时,八个位就都为 0,进位将为 1。
进位为 1,就是无符号数溢出的标志。
进位 1,代表十进制的 256。
256 也就是八位二进制的计数周期,计算机专业改称为“模”。
-----------------------------
带符号数的溢出
八位二进制也能表示【整数】,包括了【正整数、零和负整数】。
在小学学过的【整数】,在计算机专业中,改称为“带符号数”。
此时,0 ~ 127,就直接代表【零和正整数】;
128~255,是以补码代表【负整数 (-128~-1)】。
---------------
在正数最大值(+127)上再加+1,就会超出表示范围,发生溢出。
此时得到的是 128,这是负数(-128)的补码。
注意,此时的进位为 0,结果的符号错误,才是溢出的特征。
---------------
在负数最小值(-128)再加-1,也会超出范围,发生溢出。
计算如下:
1000 0000
+ 1111 1111
---------
(1) 0111 1111
此时,得到的是正数(+127)!
注意,此时的进位为 1,并无意义。
结果的符号错误,才是溢出的特征。
---------------
“带符号数”溢出的特征是:运算结果的符号,与正常结果相反。
“带符号数”的溢出,与进位是 1 是 0,并无关系。
---------------
判断是否溢出的方法
因为“带符号数”运算发生溢出,必定是结果超出范围。
所以,只有如下四种运算,才有可能出现溢出:
正数+正数、负数+负数、正数-负数、负数-正数。
其它运算如:正-正、...,就不必考虑溢出了。
由人工计算:就可根据数据的符号来判断,如:
正+正,出现负的结果;
负+负,出现正的结果;
... ...
发生上述四种之一,就是溢出。
也可考查进位与次高位的进位,两者不同,就是溢出。
用 CPU 计算:它能自动判断,如果发生溢出则会置位 OF。
-----------------------------
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)