共计 3853 个字符,预计需要花费 10 分钟才能阅读完成。
作者 | daydreamer
在互联网的服务中,C++ 罕用于搭建高性能、高并发、大流量、低延时的后端服务。如何正当的分配内存满足零碎高性能需要是一个高频且重要的话题,而且因为内存本身的特点和理论问题的简单,组合出了诸多难题。
咱们能够对内存进行多种类型的划分,从内存申请大小来看:
- 小对象调配:小于 4 倍内存页大小的内存调配,在 4KiB 页大小状况下,<16KiB 算作小对象调配;
- 大对象调配:大于等于 4 倍内存页大小的内存调配,在 4KiB 页大小状况下,>=16KiB 算作大对象调配。
从一块内存的被持有时长来看:
- 后端一次申请内甚至更短时间申请和开释
- 任意工夫窗口内内存持有和更新
- 简直与利用过程等长的内存持有和更新
- 某个过程沦亡后一段时间内,由该过程申请的仍具备意义的内存持有和开释
当然还能够依照内存申请开释频率、读写频率进行进一步的分类。
内存治理服务于利用零碎,目标是帮助零碎更好的解决瓶颈问题,比方对于『如何升高后端响应的提早和进步稳定性』内存治理可能要思考的是:
- 解决内存读写并发(读频繁 or 写频繁)升高响应工夫和 CPU 耗费
- 应用层的内存的池化复用
- 底层内存向零碎申请的内存块大小及内存碎片化
每一个问题开展可能都是一个比拟大的话题,本文作为系列文章《探秘 C ++ 内存治理》的开篇,先介绍 Linux C++ 程序内存治理的实践根底。后续会持续解密 C ++ 程序罕用的内存治理库的实现原理,包含 ptmalloc,jemalloc,tcmalloc 等,介绍以后业界风行的内存分配器如何治理 C ++ 程序的内存。理解内存分配器原理,更有助于工程师在实践中升高解决内存应用问题的老本,依据零碎量身打造应用层的内存管理体系。
一、Linux 内存治理
Linux 自底向上大抵能够被划分为:
- 硬件(Physical Hardware)
- 内核层(Kernel Space)
- 用户层(User Space)
△图 1:Linux 构造
内核模块在内核空间中运行,应用程序在用户空间中运行,二者的内存地址空间不重叠。这种办法确保在用户空间中运行的应用程序具备统一的硬件视图,而与硬件平台无关。用户空间通过应用零碎调用以可控的形式使内核服务,如:陷入内核态,解决缺页中断。
Linux 的内存管理系统自底向上大抵能够被划分为:
- 内核层内存治理 : 在 Linux 内核中 , 通过内存调配函数治理内存:
- kmalloc()/\_\_get\_free\_pages():申请较小内存(kmalloc()以字节为单位,\_\_get\_free\_pages()以一页 128K 为单位),申请的内存位于物理内存的映射区域,而且在物理上也是间断的,它们与实在的物理地址只有一个固定的偏移。
- vmalloc():申请较大内存,虚拟内存空间给出一块间断的内存区,但不保障物理内存间断,开销远大于 \_\_get\_free\_pages(),须要建设新的页表。
- 用户层内存治理:通过调用零碎调用函数(brk、mmap 等),实现罕用的内存治理接口(malloc, free, realloc, calloc)治理内存;经典内存治理库 ptmalloc2、tcmalloc、jemalloc。
- 应用程序通过内存治理库或间接调用零碎内存治理函数分配内存,依据应用程序自身的程序个性进行应用,如:单个变量内存申请和开释、内存池化复用等。
至此单个过程能够应用 Linux 提供的内存划分顺利的运行,从用户程序来看 Linux 过程的内存模型大抵如下所示:
△图 2:Linux 过程的内存模型
- 栈区(Stack):存储程序执行期间的本地变量和函数的参数,从高地址向低地址成长
- 堆区(Heap): 动态内存调配区域,通过 malloc、new、free 和 delete 等函数治理
在规范 C 库中,提供了 malloc/free 函数调配开释内存,这些函数的底层是基于 brk/mmap 这些零碎调用实现的,对照图 2 来看:
- brk(): 用于申请和开释小内存。数据段的开端,堆内存的开始,叫做 brk(program break)。通过设置 heap 的完结地址,将该地址向高或低挪动实现堆内存的扩张或膨胀。低地址内存必须在高地址内存的开释之后能力失去的开释,被标记为闲暇区的低地址,无奈被合并,如果后续再来内存空间的申请大于此闲暇区,这部分将成为内存空洞。默认状况下,当最高地址空间的闲暇内存超过 128K(可由 M\_TRIM\_THRESHOLD 选项调节)时,执行内存压缩操作(trim)。
- mmap():用于申请大内存。mmap(memory map)是一种内存映射文件的办法,行将一个文件或者其它对象映射到过程的虚拟地址空间中(堆和栈两头的文件映射区域 Memory Mapping Segment),实现文件磁盘地址和过程虚拟地址空间中一段虚拟地址的一一对映关系。实现这样的映射关系后,过程就能够采纳指针的形式读写操作这一段内存,而零碎会主动回写脏页面到对应的文件磁盘上,内核空间对这段区域的批改也间接反映用户空间,从而能够实现不同过程间的文件共享。大于 128 K 的内存,应用零碎调用 mmap()分配内存。与 brk() 分配内存不同的是,mmap() 调配的内存能够独自开释。
- munmp():开释有 mmap()创立的这段内存空间。
但在对于多个同时运行的过程,零碎仍需解决无限的物理内存和增长的内存地址等问题。那么当 Linux 存在多个同时运行的过程时,一次内存的调配过程具体都通过哪些过程呢?古代 Linux 零碎上内存的调配次要过程如下[1]:
- 应用程序通过调用内存调配函数,零碎调用 brk 或者 mmap 进行内存调配,申请虚拟内存地址空间。
- 虚拟内存至物理内存映射处理过程,通过申请 MMU 调配单元,依据虚拟地址计算出该地址所属的页面,再依据页面映射表的起始地址计算出该页面映射表 (PageTable) 项所在的物理地址,依据物理地址在高速缓存的 TLB 中寻找该表项的内容,如果该表项不在 TLB 中,就从内存将其内容装载到 TLB 中。
△图 3:Linux 内存分配机制(虚构 + 物理映射)
对于内存调配过程中波及到工具进一步分析:
- 虚拟内存(Virtual Memory):古代操作系统广泛应用的一种技术,每个过程有用独立的逻辑地址空间,内存被分为大小相等的多个块,称为页(Page)。每个页都是一段间断的地址,对应物理内存上的一块称为页框,通常页和页框大小相等。虚拟内存使得多个虚构页面共享同一个物理页面,而内核和用户过程、不同用户过程隔离。
- MMU(Memory-Management Unit):内存治理单元,负责管理虚拟地址到物理地址的内存映射,实现各个用户过程都领有本人的独立的地址空间,提供硬件机制的内存拜访权限查看,爱护每个过程所用的内存不会被其余的过程所毁坏。
- PageTable:虚拟内存至物理内存页面映射关系存储单元。
- TLB(Translation Lookaside Buffer):高速虚构地址映射缓存,次要为了晋升 MMU 地址映射解决效率,加了缓存机制,如果存在即可间接取出映射地址供应用。
这里要提到一个很重要的概念,内存的提早调配,只有在真正拜访一个地址的时候才建设这个地址的物理映射,这是 Linux 内存治理的根本思维之一。Linux 内核在用户申请内存的时候,只是调配了虚拟内存,并没有调配理论物理内存;当用户第一次应用这块内存的时候,内核会产生缺页中断,调配物理内存,建设虚拟内存和物理内存之间的映射关系。当一个过程产生缺页中断的时候,过程会陷入内核态,执行以下操作:
- 查看要拜访的虚拟地址是否非法
- 查找 / 调配一个物理页
- 填充物理页内容
- 建设映射关系(虚拟地址到物理地址)
- 从新执行触发缺页中断的指令
如果填充物理页的过程须要读取磁盘,那这次缺页中断是 majflt,否则是 minflt。咱们须要重点关注 majflt 的值,因为 majflt 对于性能的侵害是致命的,随机读一次磁盘的耗时数量级在几个毫秒,而 minflt 只有在大量的时候才会对性能产生影响。
二、总结
通过对 Linux 内存治理的介绍,咱们能够看到内存治理须要解决的问题:
- 调用零碎提供的无限接口操作虚存读写
- 衡量单次调配较大内存和屡次调配较少内存带来老本:管制缺页中断(尤其是 majflt)vs 过程占用过多内存
- 升高内存碎片
- 升高内存治理库本身带来的额定损耗
在接下来的几篇文章将就 ptmalloc,jemalloc,tcmalloc 几个经典内存治理库,与大家进一步探讨 C ++ 程序罕用的内存治理库的实现原理。
———- END ———-
相干参考:
[1]《Linux 通明大页机制在云上大规模集群实际介绍》:https://mp.weixin.qq.com/s/hGjADS9tdHeqS9XR4pkh\_w
[2] Writing a Linux Kernel Module — Part 1: Introduction: http://derekmolloy.ie/writing…
[3] https://blog.csdn.net/aliming…
[4] https://zhuanlan.zhihu.com/p/…
[5] https://zhuanlan.zhihu.com/p/…
[6] https://blog.csdn.net/agonie2…
举荐浏览【技术加油站】系列:
从零到一理解 APP 速度测评
百度工程师教你玩转设计模式(工厂模式)
揭秘百度智能测试在测试剖析畛域实际
百度用户产品流批一体的实时数仓实际
ffplay 视频播放原理剖析
百度工程师眼中的云原生可观测性追踪技术