linux多线程编程 -- __thread_系统运维

__thread 是GCC内置的线程局部存储设施，存取效率可以和全局变量相比。

__thread 变量 每一个线程有一份独立实体 ，各个线程的值互不干扰。可以用来修饰那些带有全局性且值可能变，但是又不值得用全局变量保护的变量。

只能修饰 POD 类型(类似整型指针的标量，不带自定义的构造、拷贝、赋值、析构的类型，二进制内容可以任意复制memset,memcpy,且内容可以复原)

不能修饰 class 类型，因为无法自动调用构造函数和析构函数，可以用于修饰全局变量，函数内的静态变量，不能修饰函数的局部变量或者class的普通成员变量，且__thread变量值只能初始化为编译期常量，即编译期间就能确定值。

场景说明：每个线程有一些需要保存的上下文信息，即可使用 __thread 变量

在Linux系统中使用C/C++进行多线程编程时，我们遇到最多的就是对同一变量的多线程读写问题，大多情况下遇到这类问题都是通过锁机制来处理，但这对程序的性能带来了很大的影响，当然对于那些系统原生支持原子 *** 作的数据类型来说，我们可以使用原子 *** 作来处理，这能对程序的性能会得到一定的提高。那么对于那些系统不支持原子 *** 作的自定义数据类型，在不使用锁的情况下如何做到线程安全呢？本文将从线程局部存储方面，简单讲解处理这一类线程安全问题的方法。

一、数据类型

在C/C++程序中常存在全局变量、函数内定义的静态变量以及局部变量，对于局部变量来说，其不存在线程安全问题，因此不在本文讨论的范围之内。全局变量和函数内定义的静态变量，是同一进程中各个线程都可以访问的共享变量，因此它们存在多线程读写问题。在一个线程中修改了变量中的内容，其他线程都能感知并且能读取已更改过的内容，这对数据交换来说是非常快捷的，但是由于多线程的存在，对于同一个变量可能存在两个或两个以上的线程同时修改变量所在的内存内容，同时又存在多个线程在变量在修改的时去读取该内存值，如果没有使用相应的同步机制来保护该内存的话，那么所读取到的数据将是不可预知的，甚至可能导致程序崩溃。

如果需要在一个线程内部的各个函数调用都能访问、但其它线程不能访问的变量，这就需要新的机制来实现，我们称之为Static memory local to a thread (线程局部静态变量)，同时也可称之为线程特有数据（TSD: Thread-Specific Data）或者线程局部存储（TLS: Thread-Local Storage）。这一类型的数据，在程序中每个线程都会分别维护一份变量的副本(copy)，并且长期存在于该线程中，对此类变量的 *** 作不影响其他线程。如下图：

二、一次性初始化

在讲解线程特有数据之前，先让我们来了解一下一次性初始化。多线程程序有时有这样的需求：不管创建多少个线程，有些数据的初始化只能发生一次。列如：在C++程序中某个类在整个进程的生命周期内只能存在一个实例对象，在多线程的情况下，为了能让该对象能够安全的初始化，一次性初始化机制就显得尤为重要了。——在设计模式中这种实现常常被称之为单例模式（Singleton）。Linux中提供了如下函数来实现一次性初始化：

#include <pthread.h>

// Returns 0 on success, or a positive error number on error

int pthread_once (pthread_once_t *once_control, void (*init) (void))

利用参数once_control的状态，函数pthread_once()可以确保无论有多少个线程调用多少次该函数，也只会执行一次由init所指向的由调用者定义的函数。init所指向的函数没有任何参数，形式如下：

void init (void)

{

// some variables initializtion in here

}

另外，参数once_control必须是pthread_once_t类型变量的指针，指向初始化为PTHRAD_ONCE_INIT的静态变量。在C++0x以后提供了类似功能的函数std::call_once ()，用法与该函数类似。使用

在单线程程序中，我们经常要使用全局变量来实现多个函数间共享数据。在多线程环境下，由于数据空间是共享的，因此全局变量也为所有线程所共有。但有时在应用程序设计中有必要提供线程私有的全局变量，仅在某个线程中有效，但可以跨多个函数访问，这样每个线程访问它自己独立的数据空间，而不用担心和其它线程的同步访问。

这样在一个线程内部的各个函数都能访问、但其它线程不能访问的变量，我们就需要使用线程局部静态变量 (Static memory local to a thread) 同时也可称之为线程特有数据（Thread-Specific Data 或 TSD），或者线程局部存储（Thread-Local Storage 或 TLS）。

POSIX 线程库提供了如下 API 来管理线程特有数据（TSD）：

第一参数 key 指向 pthread_key_t 的对象的指针。请注意这里 pthread_key_t 的对象占用的空间是用户事先分配好的， pthread_key_create 不会动态生成 pthread_key_t 对象。

第二参数 desctructor ，如果这个参数不为空，那么当每个线程结束时，系统将调用这个函数来释放绑定在这个键上的内存块。

有时我们在线程里初始化时，需要避免重复初始化。我们希望一个线程里只调用 pthread_key_create 一次，这时就要使用 pthread_once 与它配合。

第一个参数 once_control 指向一个 pthread_once_t 对象，这个对象必须是常量 PTHREAD_ONCE_INIT ，否则 pthread_once 函数会出现不可预料的结果。

第二个参数 init_routine ，是调用的初始化函数，不能有参数，不能有返回值。

如果成功则返回0，失败返回非0值。

创建完键后，必须将其与线程数据关联起来。关联后也可以获得某一键对应的线程数据。关联键和数据使用的函数为：

第一参数 key 指向键。

第二参数 value 是欲关联的数据。

函数成功则返回0，失败返回非0值。

注意： 用 pthread_setspecific 为一个键指定新的线程数据时，并不会主动调用析构函数释放之前的内存，所以调用线程必须自己释放原有的线程数据以回收内存。

获取与某一个键关联的数据使用函数的函数为：

参数 key 指向键。

如果有与此键对应的数据，则函数返回该数据，否则返回NULL。

删除一个键使用的函数为：

参数 key 为要删除的键。

成功则返回0，失败返回非0值。

注意： 该函数将键设置为可用，以供下一次调用 pthread_key_create() 使用。它并不检查当前是否有线程正在使用该键对应的线程数据，所以它并不会触发函数 pthread_key_create 中定义的 destructor 函数，也就不会释放该键关联的线程数据所占用的内存资源，而且在将 key 设置为可用后，在线程退出时也不会再调用析构函数。所以在将 key 设置为可用之前，必须要确定:

在 Linux 中每个进程有一个全局的数组 __pthread_keys ，数组中存放着称为 key 的结构体，定义类似如下：

在 key 结构中 seq 为一个序列号，用来作为使用标志指示这个结构在数组中是否正在使用，初始化时被设为0，即表示不在使用。 destructor 用来存放一个析构函数指针。

pthread_create_key 会从数组中找到一个还未使用的 key 元素，将其序列号 seq 加1，并记录析构函数地址，并将 key 在数组 __pthread_keys 中的下标作为返回值返回。那么如何判断一个 key 正在使用呢？

如果 key 的序列号 seq 为偶数则表示未分配，分配时将 seq 加1变成奇数，即表示正在使用。这个 *** 作过程采用原子 CAS 来完成，以保证线程安全。在 pthread_key_delete() 时也将序列号 seq 加1，表示可以再被使用，通过序列号机制来保证回收的 key 不会被复用（复用 key 可能会导致线程在退出时可能会调用错误的析构函数）。但是一直加1会导致序列号回绕，还是会复用 key ，所以调用 pthread_create_key 获取可用的 key 时会检查是否有回绕风险，如果有则创建失败。

除了进程范围内的 key 结构数组外，系统还在进程中维护关于每个线程的控制块 TCB（用于管理寄存器，线程栈等），里面有一个 pthread_key_data 类型的数组。这个数组中的元素数量和进程中的 key 数组数量相等。 pthread_key_data 的定义类似如下：

根据 pthread_key_create() 返回的可用的 key 在 __pthread_keys 数组中的下标， pthread_setspecific() 在 pthread_key_data 的数组中定位相同下标的一个元素 pthread_key_data ，并设置其序号 seq 设置为对应的 key 的序列号，数据指针 data 指向设置线程特有数据（TSD）的值。

pthread_getspecific() 用于将 pthread_setspecific() 设置的 data 取出。

线程退出时， pthread_key_data 中的序号 seq 用于判断该 key 是否仍在使用中（即与在 __pthread_keys 中的同一个下标对应的 key 的序列号 seq 是否相同），若是则将 pthread_key_data 中 data（即线程特有数据 TSD）作为参数调用析构函数。

由于系统在每个进程中 pthread_key_t 类型的数量是有限的，所有在进程中并不能获取无限个 pthread_key_t 类型。Linux 中可以通过 PTHREAD_KEY_MAX（定义于 limits.h 文件中）或者系统调用 sysconf(_SC_THREAD_KEYS_MAX) 来确定当前系统最多支持多少个 key 。 Linux 中默认是 1024 个 key，这对大多数程序来书已经够了。如果一个线程中有多个线程局部存储变量（TLS），通常可以将这些变量封装到一个数据结构中，然后使用封装后的数据结构和一个线程局部变量相关联，这样就能减少对键值的使用。

https://blog.csdn.net/hustraiet/article/details/9857919

https://blog.csdn.net/caigen1988/article/details/7901248

http://www.bidutools.com/?p=2443

https://spockwangs.github.io/blog/2017/12/01/thread-local-storage/

https://www.jianshu.com/p/71c2f80d7bd1

https://blog.csdn.net/cywosp/article/details/26469435

http://www.embeddedlinux.org.cn/emblinuxappdev/117.htm

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/yw/8455829.html

linux多线程编程 -- __thread

发表评论

评论列表（0条）