根据《 The C Programming language》推测得到堆内存,图中的 Heap区域即为堆内存块( Heap区域的数目不代表计算机堆内存的真实数目)。
[1] 堆内存不连续。只有标识为 Heap的才是堆内存。
[2] 在malloc()/free()看来,每个Heap所代表的的堆由两部分组成: Header +可给用户使用的堆内存 。在Header中包含了“指向下一邻近高地址堆内存块的指针”、“本堆块的大小”。每次由malloc()函数分配给用户的堆内存也必须包含Header结构(且所占内存就在返回给用户使用的堆内存之前),这样是为了让malloc()/free()更好的管理堆内存。
[3] malloc()/free()函数操作的堆内存是如图所示的一个链(Heap1 -> Heap2 ->Heap3 ->Heap4 ->Heap1),可通过此链表访问到任意一段堆内存。所以, 经malloc()函数实际分配得到的堆内存要比用户实际需求的要大一个Header,只是返回给用户的堆内存大小刚好是用户所需。free()释放时,也要根据Header的内容将此段曾供给用户使用过得堆内存释放到最邻近的一个堆块中去。
这就是内存中的堆内存。堆内存由用户用代码分配及回收。堆和栈的区别不仅在于内存的存在形式,在使用时栈一般拥有内存名即栈内存可以由内存名(变量名)直接访问,也可以通过地址(指针)访问栈内存。但对于堆内存来说,堆不存在内存名,只有通过地址(指针)访问。
假设从《The C Programming Language》中推测正确,从未经动态分配的堆内存呈现上图形式。不连续的堆内存以“链”的形式联系: Heap1 -> Heap2 ->Heap3 ->Heap4->Heap1 。笔迹将构成“堆链”的每个堆内存(如Heap1)称为“堆块”。malloc()/free()将每个堆块看作由两部分构成:“Header”和“可用堆内存”。在Header中包含了“指向下一个堆内存块的指针”、“本堆块的大小”。这样malloc()/free()就能更好地管理堆。
由于Header的构成的内存对齐,C中malloc(n)函数分配的堆内存会大于等于Header + n。
可先参见位经malloc()函数申请分配的堆内存在计算机中的形式: 计算机中的堆 。
经malloc()分配过得堆内存结构如下:
Read From《 The C Programming Language》。
可用的堆内存块以“可用堆内存链表”的形式存在。 malloc()进行动态分配的特点:
如果整个堆链表所代表的堆内存块都没有大于等于 n的堆内存块,系统将给“堆链表”链接一个更大的区域供其使用。要是这一步也失败了, malloc()函数就返回 NULL给用户。
malloc()函数分配内存成功则返回可用堆内存块的首地址,若分配失败则返回空。在使用 malloc()后一定要判断堆内存是否成功。若对内存分配未成功使用指针操作内存也会使程序出现异常。动态分配内存时要采取以下结构:
分配成功后,得到的堆内存首地址一定要保存,不然后来无法释放堆内存而造成内存泄露。而且不可使用未初始化的 pL指向的内存块。
指针名所代表的4 bytes内存上存了堆内存的首地址后,访问这块堆内存内容跟平时使用指针差不多。可以以指针的形式访问(甚用p++ || ++p,堆内存首地址可不要丢失,留着释放),也可以使用下标的形式访问。
当使用 free()函数释放堆内存的时候, free()函数将堆内存插入到于要释放堆内存地址最邻近的一个位置上,尽可能的使堆内存以大块的形式存在而不至于让堆内存称为碎片。
释放未指向任何堆内存块的指针也会造成内存泄露。所以在释放指针前的一个基本操作是判断指针内容是否为空, free(p)后只是将 p指向的内存回收, p的值依旧存在,为避免再次使用 p的值还需要将 p赋值为 NULL(因为使用指针前都会判断是否为 NULL)。释放堆内存块采取这样的程序结构:
有笔记“ C中的void和NULL ”表面引用NULL指针的后果。为了更好的利用指针,避免野指针(指针所指的内存块不可用)的使用在所有使用指向堆内存块的指针前都采取如此的结构:
定义指针后将其值赋值为 NULL。此时指针指向的内存地址为 NULL, NULL对指针的赋值是将指针置成空指针(什么也没有指向)还是将指针指向了一段特殊的地址取决于编译器,编程中我们不需要了解 NULL到底代表什么,只需要用 NULL来避免指针带来的后果。
定义指针后将其赋值为 NULL之后的好处在于避免系统给予局部指针变量的随机值,我们在使用指针前( malloc()除外)都判断一下指针的值是否为 NULL,只有在不为空的情况下才能对此进行操作,如 free(p),若在不判断 p是否为空的情况下进行 free(p)操作则会造成内存泄露。
判断指针是否为 NULL的主要针对对象是指向堆内存的指针。比如在以下内存拷贝函数中:
程序中首先判断两个地址是否为空。判断 StrTo是为了了解 StrTo是否指向一段空间。当然若 StrTo指向一个常数,往后拷贝操作还得出错。
像这样带指针参数的子函数内都很有必要有这么一段判断指针是否为 NULL的语句,故而可以将这样的代码写成函数来供大家使用,再考虑此代码段比较小可以用宏代替。这样的(带参数)宏可称为断言,因为当指针未空时就退出子函数(如 assert())。
如以上一段判断子函数是否为空可以用如下宏代替,形成一个断言:
然后在每个程序中直接调用 MY_ASSERT(pStrTo, pStrFrom);即可。由于这样的宏(断言)可能供许多函数的使用,所以一定要保证它的正确性。
内存块重叠指多个指针指向的内存有重叠的情况。对内存块的操作是否会影响源内存块的内容(如内存数据拷贝)。
两指针指向的内存块重叠
如上图将 p2指向内存的数据拷贝给 p1代表的内存中去后, p2指向的内存块数据也被改变。堆内存块的操作不要有副作用。
(1)用 NULL(因其特殊性)来统一标识指针的可用性。使用指针前都应该判断一下指针是否为 NULL。
(2)将局部指针变量初始化为 NULL(消除系统给其赋的随机值,系统为其赋随机值也就造就了野指针)。
(3)指针用于指向堆内存时需要注意:
malloc()后一定要判断是否 malloc()成功。 malloc()成功后一定要保存所分配堆内存块的首地址。
(4)使用指针前都应该判断一下指针是否为 NULL。
完全使用完某个指针或释放指向堆内存的指针后,将其值赋值为空。指向堆内存的指针在释放完需要赋值为空的理由见 free () 堆内存 。对于指针定义时初始化和完全使用完指针后再将其值赋为 NULL的道理在于所有使用指针的语句前都会有有判断指针是否为 NULL的语句。 尤其是在子函数内判断指向堆内存块的指针实参是否为 NULL 。
对于C中的malloc(n)分配,有以下进一步的结论: