关于机器学习:探秘持久内存PMem中无锁实现多线程安全的持久化数据结构

起源：原创
如需转载，请注明来自 MemArk 技术社区（MemArk 技术社区 - 助力先进存储架构演进）

对于作者

杨俊，博士毕业于香港科技大学计算机系，在数据库和存储系统上有超过十年的丰盛钻研和实践经验；现就职于第四范式任零碎架构师，同时也是分级存储技术社区 MemArk (https://memark.io/) 的核心成员。近期，因为其在长久内存编程外围社区 Persistent Memory Programming （https://pmem.io/）的卓越贡献，成为被该社区吸纳的中国第一位社区外围贡献者（reviewer）。本文将会介绍作者最近一次的代码奉献，对该社区的后续技术倒退有深远影响。

一、背景

长久内存(PMem) 尽管能够保障写入PMem的数据掉电重启后不会失落，但写入PMem的数据往往须要先写到CPU Cache里，再通过一系列CPU 指令把数据刷到PMem中。因为PMem和CPU的硬件限度，向PMem中写入大于8字节的数据并长久化无奈保障写操作的原子性（即如果在长久化写入数据过程中掉电，无奈保证数据残缺写完），所以在PMem中保障长久化数据结构的数据一致性是十分有挑战性的。如果该长久化数据结构还须要反对正确的多线程写操作，保证数据一致性将变得更加简单。本文次要形容此背景下的长久化数据的一致性、可见性问题。

本文适宜对于长久化编程有肯定根底理解的开发者浏览，本文次要蕴含内容：

介绍PMem无锁编程中的数据可见性、一致性问题及解决办法。
介绍本文作者最近刚合入 libpmemobj-cpp 的一个PR，专门为不便实现Single-Writer-Multiple-Reader（SWMR)多线程长久化数据结构的一种自带原子性的长久化指针（Atomic Persistent Pointer）。可在此具体参考该 PR 的探讨开发过程。

二、PMem的无锁编程

数据可见性是PMem无锁编程的十分重要的难点之一。例如某一线程应用STORE指令批改了一个内存数据，新数据可能在未长久化到PMem时（仍在CPU Cache中）就被另一线程读取。假如有如下两个线程别离应用带来原子性的atomic_write和atomic_read来写入和读取数据：

// 线程1// pmem->a初始化为0atomic_store(&pmem->a, 1);                      // 可见性：是, 长久化：未知pmem_persist(&pmem->a, sizeof(pmem->a));        // 可见性：是, 长久化：是 // 线程2// pmem->b初始化为0if (atomic_load(&pmem->a) == 1) {    pmem->b = 1;                                // 可见性：是, 长久化：未知    pmem_persist(&pmem->b, sizeof(pmem->b));    // 可见性：是, 长久化：是}

依据程序解体停止的工夫点不同，咱们从线程2的角度来剖析a和b的值的各种可能性：

如果在线程1开始前程序停止，则：pmem->a=0，pmem->b=0
如果在两个线程都实现后程序停止，则：pmem->a=1，pmem->b=1
如果在线程1完结后程序停止，则：pmem→a=1，pmem→b=0

图1：数据一致性问题

然而如图1所示，如果思考到PMem的长久化个性带来的数据可恢复性，如果在线程1刚执行完atomic_store未执行pmem_persist时，而线程2执行完pmem_persist后零碎掉电，因为pmem->a并未长久化pmem->b已长久化，将会导致pmem->a=0,pmem->b=1这种未预料到的状况产生。

导致这种数据与程序逻辑不统一的问题呈现的次要起因，是线程2的操作依赖于未被长久化的数据。所以防止这种数据不统一的办法之一，就是在读取数据之后马上进行一次额定的长久化操作，比方线程2能够改成：

// 线程2// pmem->b初始化为0if (atomic_load(&pmem->a) == 1) {    pmem_persist(&pmem->a, sizeof(pmem->a));    // 可见性：是, 长久化：是    pmem->b = 1;                                // 可见性：是, 长久化：未知    pmem_persist(&pmem->b, sizeof(pmem->b));    // 可见性：是, 长久化：是}

这种办法能够无效防止pmem->a=0，pmem->b=1的状况呈现（前提是写入线程只有一个，读者能够思考如果写入线程不只一个，此办法会有什么问题）。然而代价也不小，因为每次读取都须要进行一次额定的长久化操作。为了进一步优化性能，咱们提出了一种长久化智能指针，不仅反对原子操作，且能依据理论状况，只进行必要的长久化操作。

三、反对原子操作的长久化指针

以下为反对原子操作的智能化指针的具体实现逻辑：

为了反对无锁编程，咱们必须应用8字节作为长久化指针的大小，然而pmdk和libpmemobj-cpp中，公开材料中可供使用的长久化指针(persistent_ptr)是16字节的“宽指针”。在与Intel团队沟通交流后，咱们理解到了一个仍处于试验测试阶段的新长久化指针：self_relative_ptr（自偏移指针）。这种长久化指针，奇妙地通过保留数据的地址与此指针对象自身在PMem中的地址之间偏移量（8字节），将长久化指针放大为8字节，为长久化指针带来了反对原子操作的可能。
在self_relative_ptr的根底上，咱们进一步发现，反对原子操作的数据地址都必须是8字节对齐的，所以其地址的低3位始终为0。于是，咱们通过复用指针地址最低位，作为dirty_flag来辨别读取前须要先长久化的指针。最终咱们实现了一种反对原子操作的长久化指针：atomic_persistent_aware_ptr。该类最重要的两个API就是相似于atomic规范类的store/load，能够原子性的读取和写入self_relative_ptr对象，具体流程如下：

a. Store

批改传入的self_relative_ptr对象所指向的地址，将最低位设为1，示意此指针未长久化
将批改后self_relative_ptr中通过原子写，保留到外部的atomic对象中
b. Load
通过原子读，失去外部atomic对象中的self_relative_ptr
如果该self_relative_ptr最低位为1，则进行一次长久化操作，并应用CAS(compare-and-swap，规范atomic类反对的一种原子操作，在条件成立时赋值）将外部atomic对象中的self_relative_ptr的最低位清零
返回最低位清零后的self_relative_ptr

不难发现，上述操作只在Load时，self_relative_ptr最低位为1时才进行长久化操作，并在长久化后将最低位清0，无效的防止了反复进行长久化操作，且保障了数据可见时已长久化。
读者可能还留神到，咱们将长久化操作与写操作（Store）进行了拆散，能够说是一种对写多读少场景的优化，与此对应的，咱们也实现了一个针对写少读多场景的优化。具体详情可参考源代码。

以上实现逻辑曾经合入 libpmemobj-cpp，具体源代码能够参考：atomic_persistent_aware_ptr 。在此长久化指针的根底上，正确实现上述的例子将会变得非常简单，且不会呈现a=0，b=1的数据不统一状况呈现：

// 应用libpmemobj-cpp的transaction调配PMem对象能够保障无内存泄露self_relative_ptr<int> one;try {    pmem::obj::transaction::run(pop, [&] {        one = nvobj::make_persistent<int>();    //在PMem中调配一个int        *one = 1;                               //设为1        pmem_persist(one, sizeof(int));         //长久化    });} catch (...) {    ASSERT_UNREACHABLE;}  // 线程1atomic_persistent_aware_ptr<int> a;a.store(one);                                   //间接应用atomic_persistent_aware_ptr提供的store函数写入 // 线程2atomic_persistent_aware_ptr<int> b;if (*(a.load()) == 1) {                         //间接应用atomic_persistent_aware_ptr提供的load函数读取    b.store(one);}

四、浏览更多

MemArk 社区官网：https://memark.io/
分级存储技术专栏
Join Slack Workspace
扫码进入分级存储微信技术探讨群（点击关上二维码）