【PHP源码分析】small内存规格的计算

作者：李德small内存分配计算bin_num在PHP源码中，有一段对small内存规格的计算，具体在Zend/zend_alloc.c的zend_mm_small_size_to_bin函数中，其目的是传入一个size，计算对应的规格。见代码：if (size <= 64) { /* we need to support size == 0 … / return (size - !!size) >> 3;} else { t1 = size - 1; t2 = zend_mm_small_size_to_bit(t1) - 3; t1 = t1 >> t2; t2 = t2 - 3; t2 = t2 << 2; return (int)(t1 + t2);}可以看出，这段代码中分为两种情况进行讨论：1、size小于等于64的情况；2、size大于64的情况；下面我们对这两种情况详细分析下。对于size小于等于64的情况看ZEND_MM_BINS_INFO这个宏知道当size小于等于64的情况是一个等差数列，递增8，所以使用size除以8就行（源码中是右移3位）size >> 3但是要考虑到size等于8、16等的情况，所以为 (size - 1) >> 3然后要考虑到为0的情况，所以源码中对于-1的处理是!!size，当size为0的情况!!0 = 0。所以当size为0的情况就把-1转换成了-0，最终有了源码中的表达式 (size - !!size) >> 3对于size大于64的情况t1 = size - 1;t2 = zend_mm_small_size_to_bit(t1) - 3;t1 = t1 >> t2;t2 = t2 - 3;t2 = t2 << 2;return (int)(t1 + t2);初始懵逼初看这个代码，容易一脸懵逼，这些t1 t2 都是啥啊不过不用怕，我们一点点来分析步骤分析/ num, size, count, pages /#define ZEND_MM_BINS_INFO(_, x, y) \ _( 0, 8, 512, 1, x, y) \ _( 1, 16, 256, 1, x, y) \ _( 2, 24, 170, 1, x, y) \ _( 3, 32, 128, 1, x, y) \ _( 4, 40, 102, 1, x, y) \ _( 5, 48, 85, 1, x, y) \ _( 6, 56, 73, 1, x, y) \ _( 7, 64, 64, 1, x, y) \ _( 8, 80, 51, 1, x, y) \ _( 9, 96, 42, 1, x, y) \ _(10, 112, 36, 1, x, y) \ _(11, 128, 32, 1, x, y) \ _(12, 160, 25, 1, x, y) \ _(13, 192, 21, 1, x, y) \ _(14, 224, 18, 1, x, y) \ _(15, 256, 16, 1, x, y) \ _(16, 320, 64, 5, x, y) \ _(17, 384, 32, 3, x, y) \ _(18, 448, 9, 1, x, y) \ _(19, 512, 8, 1, x, y) \ _(20, 640, 32, 5, x, y) \ _(21, 768, 16, 3, x, y) \ _(22, 896, 9, 2, x, y) \ _(23, 1024, 8, 2, x, y) \ _(24, 1280, 16, 5, x, y) \ _(25, 1536, 8, 3, x, y) \ _(26, 1792, 16, 7, x, y) \ _(27, 2048, 8, 4, x, y) \ _(28, 2560, 8, 5, x, y) \ _(29, 3072, 4, 3, x, y)#endif / ZEND_ALLOC_SIZES_H /size = size - 1; 这个是边界情况，跟前面一样，后面出现的size暂且都认为已近减一了假设不看这个源码，我们要实现在ZEND_MM_BINS_INFO中找到对应的bin_num由ZEND_MM_BINS_INFO得知后续的增加4个为一组，分别为2^4, 2^5, 2^6… 有了这个分组信息的话，我们要找siez对应的bin_num找到这个size属于哪一组并且size在组内的偏移是多少计算组的起始位置那现在问题转换成了上面3个小问题，我们一个一个来解决找到size属于哪一组最简单的办法就是比大小是吧，可以使用if…else 来一个一个比，但是显然php源码不是这样干的，那我们还有什么其它的办法呢？我们看十进制看不出来什么名堂，就把这些值转成二进制看看吧64 | 100 000080 | 101 000096 | 110 0000112 | 111 0000128 | 1000 0000160 | 1010 0000192 | 1100 0000224 | 1110 0000256 | 1 0000 0000320 | 1 0100 0000384 | 1 1000 0000448 | 1 1100 0000…..我们看下上面的二进制，会发现每组的内的二进制长度相等，并且后面每个都比前面多一位那就是说我们可以计算二进制的长度来决定它的分组，那么二进制的长度又是啥呢，其实就是当前二进制的最高位为1的位数那么问题又转换成了求二进制中最高位的1的位数下面给出php源码的解法，这里暂时不对其解析，只要知道它返回的是二进制中最高位的1的位数int n = 16;if (size <= 0x00ff) {n -= 8; size = size << 8;}if (size <= 0x0fff) {n -= 4; size = size << 4;}if (size <= 0x3fff) {n -= 2; size = size << 2;}if (size <= 0x7fff) {n -= 1;}return n;假设我们申请的size为65，那么这里的n返回7计算size在组内的偏移量这个简单，直接用size减去每组的起始siez大小然后除以当前组内的差值（16、32、64…）即可，也就是(size-64)/16 (size-128)/32 (size-256)/64现在来看看上一步中的返回的值，每个组分别是7、8、9…，那么我们现在来看看这样的数据怎么计算组内的偏移量(size - 2^4 * 4) / 16 = size / 2^4 - 4(size - 2^5 * 4) / 32 = size / 2^5 - 4 (size - 2^6 * 4) / 64 = szie / 2^6 - 4那是不是可以用7、8、9减去3得到4、5、6，这样我们就可以根据它在哪一组的信息得到当前组的差值（16、32、64…）当size为65时，偏移量是不是就是(64-64) / 2^4 = 0计算组的起始位置现在我们有了偏移量的信息，假定我们分组是1、2、3那是不是就是用最高位的1的位数减去6就可以得到分组信息了得到分组信息之后，怎么知道每组的起始位置呢我们知道起始位置分别是8、12、16…它也是一个等差数列，就是4n+4我们在看看size=65的那个例子计算的偏移量是0计算的起始位置是41 + 4 = 8所以当size=65的bin_num就是起始位置加上偏移量 8 + 0 = 8我们再看一个size=129的例子偏移量是二进制中最高位的1的位数为8然后用8减去3得到5(129 - 1 - 32 * 4) / 64 = 0计算起始位置是 4 * 2 + 4 = 12两者相加就是 12 + 0 = 0size=193偏移量是二进制中最高位的1的位数为8(193 - 1 - 32 * 4) / 64 = 2计算起始位置是 4 * 2 + 4 = 12两者相加就是 12 + 2 = 14size=1793偏移量是二进制中最高位的1的位数为11(1793 - 1 - 256 * 4) / 256 = 3计算起始位置是 4 * 5 + 4 = 24两者相加就是 24 + 3 = 27代码分析php实现代码1 t1 = size - 1;2 t2 = zend_mm_small_size_to_bit(t1) - 3;3 t1 = t1 >> t2;4 t2 = t2 - 3;5 t2 = t2 << 2;6 return (int)(t1 + t2);第一行t1 = size - 1;是为了考虑size为64、128…这些边界情况第二行t2 = zend_mm_small_size_to_bit(t1) - 3;这里调用了zend_mm_small_size_to_bit这个函数，我们看看这个函数/* higher set bit number (0->N/A, 1->1, 2->2, 4->3, 8->4, 127->7, 128->8 etc) */int n = 16;if (size <= 0x00ff) {n -= 8; size = size << 8;}if (size <= 0x0fff) {n -= 4; size = size << 4;}if (size <= 0x3fff) {n -= 2; size = size << 2;}if (size <= 0x7fff) {n -= 1;}return n;看注释我们就知道这个函数是用来返回当前size二进制中最高位1的位数，具体的做法呢其实就是二分法我们通过zend_mm_small_size_to_bit这个函数获取了size二进制中最高位1的位数，那么这个 -3 是什么神奇的操作呢上问的分析中提到，我们计算size在组内的偏移量的公式(size - 2^4 * 4) / 16 = size / 2^4 - 4 (size - 2^5 * 4) / 32 = size / 2^5 - 4 (size - 2^6 * 4) / 64 = szie / 2^6 - 4这里获取二进制的位数是7、8、9…通过 -3 的操作来获取相应的 4、5、6…第三行 t1 = t1 >> t2;把t1右移t2位，这又是什么神奇的操作？这里我们把最后计算bin_num的数学公式给写出来，它是等于每组的起始位置加上组内的偏移量binnum = (4n + 4) + (size / 2^n - 4)binnum = 4n + size / 2^n所以第三行的意思我们就知道了，就是size右移2^n次方为第四行t2 = t2 - 3;这个好理解，可以参照上文得到每组的起始位置的方法第五行t2 = t2 << 2;我们再看看bin_num的计算公式binnum = (4n + 4) + (size / 2^n - 4)binnum = 4n + size / 2^n那么这行就好理解了，就是计算每组的起始位置4n对吧，左移两位就是乘以4第六行return (int)(t1 + t2);这行没啥说的，就是返回了一个int类型的bin_num