首页 >后端开发 >C++ >如何使用 CAS 在 C 11 中实现无锁 ABA 计数器并最小化性能开销?

如何使用 CAS 在 C 11 中实现无锁 ABA 计数器并最小化性能开销?

Susan Sarandon
Susan Sarandon原创
2024-12-15 08:07:11836浏览

How can I implement a lock-free ABA counter in C  11 using CAS and minimize performance overhead?

如何使用 c 11 CAS 实现 ABA 计数器?

要同时原子地更新两个值,请创建一个原子的相邻结构。假设您使用 std::atomic;来实施这一点。然后,将发生以下操作:

  1. 通过 gcc 编译在 x86-64 处理器上利用 lock cmpxchg16b 指令。
  2. 避免内联汇编并优先使用 C 语法以提高效率。
  3. 使用联合来实现单个结构成员的高效加载。
  4. 确保16B(或 32 位指针为 8B)对齐,以防止 x86 架构上的性能问题。
  5. 对于 x86-64 版本使用 -mcx16,因为早期 x86-64 CPU 并不始终支持 cmpxchg16b。

注意原子对象应该是无锁的,特别是对于x86 CPU。像 gcc7 及更高版本的编译器可能会调用 libatomic 而不是使用内联锁 cmpxchg16b。在这种情况下,请考虑以下事项:

  • 验证编译器是否生成有效的代码来读取各个成员,而无需求助于该对的 cmpxchg16b 锁。
  • 确保访问一个联合成员修改后,另一个是明确定义的实现。这在 GNU C 中是合法的,但如果严格遵守 ISO C,可能会导致未定义的行为。
  • 确保对象正确对齐,因为未对齐可能会导致 x86 架构上的性能下降。
  • 保持 32 位指针的对齐,因为大于指针的原子对象可能在 x86-64 上使用锁CPU。

以下是展示这些特征的 C 11 代码示例:

#include <atomic>
#include <stdint.h>

using namespace std;

struct node {
  struct alignas(2*sizeof(node*)) counted_ptr {
    node *    ptr;
    uintptr_t count;  // use pointer-sized integers to avoid padding
  };

  // hack to allow reading just the pointer without lock-cmpxchg16b,
  // but still without any C++ data race
  struct counted_ptr_separate {
    atomic<node *>    ptr;
    atomic<uintptr_t> count_separate;  // var name emphasizes that accessing this way isn't atomic with ptr
  };

  static_assert(sizeof(atomic<counted_ptr>) == sizeof(counted_ptr_separate), "atomic<counted_ptr> isn't the same size as the separate version; union type-punning will be bogus");
  // TODO: write member functions to read next.ptr or read/write next_and_count

  union {  // anonymous union: the members are directly part of struct node
    alignas(2*sizeof(node*)) atomic<counted_ptr> next_and_count;
    counted_ptr_separate  next;
  };
};

总之,同时原子地修改两个值需要仔细的设计、编译器考虑和对齐优化。通过遵循这些准则,您可以使用高效且正确的代码在 C 11 中实现无锁 ABA 计数器。

以上是如何使用 CAS 在 C 11 中实现无锁 ABA 计数器并最小化性能开销?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn