BSS段:BSS段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。
数据段:数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。
代码段:代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。
堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)
栈(stack):栈又称堆栈, 是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。
【例一】
用cl编译两个小程序如下:
程序1:
intar[30000];
voidmain()
{
......
}
程序2:
intar[300000]={1,2,3,4,5,6};
voidmain()
{
......
}
发现程序2编译之后所得的.exe文件比程序1的要大得多。当下甚为不解,于是手工编译了一下,并使用了/FAs编译选项来查看了一下其各自的.asm,发现在程序1.asm中ar的定义如下:
_BSSSEGMENT
ar@@3PAHADD0493e0HDUP(?);ar
_BSSENDS
而在程序2.asm中,ar被定义为:
_DATASEGMENT
ar@@3PAHADD01H;ar
DD02H
DD03H
ORG$+1199988
_DATAENDS
区别很明显,一个位于.bss段,而另一个位于.data段,两者的区别在于:全局的未初始化变量存在于.bss段中,具体体现为一个占位符;全局的已初始化变量存于.data段中;而函数内的自动变量都在栈上分配空间。.bss是不占用.exe文件空间的,其内容由操作系统初始化(清零);而.data却需要占用,其内容由程序初始化,因此造成了上述情况。
【例二】
编译如下程序(test.cpp):
#include <stdio.h>
#define LEN 1002000
int inbss[LEN];
float fA;
int indata[LEN]={1,2,3,4,5,6,7,8,9};
double dbB = 100.0;
const int cst = 100;
int main(void)
{
int run[100] = {1,2,3,4,5,6,7,8,9};
for(int i=0; i<LEN; ++i)
printf("%d ", inbss[i]);
return 0;
}
命令:cl /FAtest.cpp回车(/FA:产生汇编代码)
产生的汇编代码(test.asm):
TITLEtest.cpp
.386P
include listing.inc
if @Version gt 510
.model FLAT
else
_TEXTSEGMENT PARA USE32 PUBLIC "CODE"
_TEXTENDS
_DATASEGMENT DWORD USE32 PUBLIC "DATA"
_DATAENDS
CONSTSEGMENT DWORD USE32 PUBLIC "CONST"
CONSTENDS
_BSSSEGMENT DWORD USE32 PUBLIC "BSS"
_BSSENDS
_TLSSEGMENT DWORD USE32 PUBLIC "TLS"
_TLSENDS
FLATGROUP _DATA, CONST, _BSS
ASSUMECS: FLAT, DS: FLAT, SS: FLAT
endif
PUBLICinbss@@3PAHA; inbss
PUBLICfA@@3MA; fA
PUBLICindata@@3PAHA; indata
PUBLICdbB@@3NA; dbB
_BSSSEGMENT
inbss@@3PAHA DD 0f4a10H DUP (?); inbss
fA@@3MA DD01H DUP (?); fA
_BSSENDS
_DATASEGMENT
indata@@3PAHA DD 01H; indata
DD02H
DD03H
DD04H
DD05H
DD06H
DD07H
DD08H
DD09H
ORG $+4007964
dbB@@3NA DQ04059000000000000r; 100; dbB
_DATAENDS
PUBLIC_main
EXTRN_printf:NEAR
_DATASEGMENT
$SG537DB"%d ", 00H
_DATAENDS
_TEXTSEGMENT
_run$ = -400
_i$ = -404
_mainPROC NEAR
; File test.cpp
; Line 13
pushebp
movebp, esp
subesp, 404; 00000194H
pushedi
; Line 14
movDWORD PTR _run$[ebp], 1
movDWORD PTR _run$[ebp+4], 2
movDWORD PTR _run$[ebp+8], 3
movDWORD PTR _run$[ebp+12], 4
movDWORD PTR _run$[ebp+16], 5
movDWORD PTR _run$[ebp+20], 6
movDWORD PTR _run$[ebp+24], 7
movDWORD PTR _run$[ebp+28], 8
movDWORD PTR _run$[ebp+32], 9
movecx, 91; 0000005bH
xoreax, eax
leaedi, DWORD PTR _run$[ebp+36]
rep stosd
; Line 15
movDWORD PTR _i$[ebp], 0
jmpSHORT $L534
$L535:
moveax, DWORD PTR _i$[ebp]
addeax, 1
movDWORD PTR _i$[ebp], eax
$L534:
cmpDWORD PTR _i$[ebp], 1002000; 000f4a10H
jgeSHORT $L536
; Line 16
movecx, DWORD PTR _i$[ebp]
movedx, DWORD PTR ?inbss@@3PAHA[ecx*4]
pushedx
pushOFFSET FLAT:$SG537
call_printf
addesp, 8
jmpSHORT $L535
$L536:
; Line 17
xoreax, eax
; Line 18
popedi
movesp, ebp
popebp
ret0
_mainENDP
_TEXTENDS
END
----------------------------------------
通过汇编文件可以看到,数组inbss和indata位于不同的段(inbss位于bss段,而indata位于data段)
若把test.cpp中的indata数组拿掉,查看生成的exe文件的大小,可以发现,indata拿掉之后exe文件的大小小了很多。而若拿掉的是inbss数组,exe文件大小跟没拿掉时相差无几。
说明了:
bss段(未手动初始化的数据)并不给该段的数据分配空间,只是记录数据所需空间的大小。
data(已手动初始化的数据)段则为数据分配空间,数据保存在目标文件中。
数据段包含经过初始化的全局变量以及它们的值。BSS段的大小从可执行文件中得到,然后链接器得到这个大小的内存块,紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含数据段和BSS段的整个区段此时通常称为数据区。