多线程基础入门【Linux之旅】——下篇【死锁,条件变量,生产消费者模型,信号量】

2024-01-07 18:31:55

目录

一,死锁

1. 死锁的必要条件

2,避免死锁

二,条件变量?

同步概念与竞态条件

条件变量——初始化

静态初始化?

动态初始化

pthread_cond_destroy (销毁)

pthread_cond_wait? (等待条件满足)

pthread_cond_signal (唤醒线程)

phread_cond_broadcast (广播线程)

?条件变量使用规范

那为什么使用条件变量??

三,生产消费者模型

四,POSIX信号量

?1.理解信号量:

2. 接口

初始化信号量

销毁信号量

等待信号量(P操作——原子性)

发布信号量(V操作——原子性)

3. 重写生产消费者模型

RingQueue.hpp

sem_num.hpp

下期:网络编程!!

结语


嘿!收到一张超美的风景图,希望你每天都能顺心!?

一,死锁

死锁是指在一组进程中的各个进程均占有不会释放的资源,但因互相申请被其他进程所站用不会释放的资源而处于的一种永久等待状态。

1. 死锁的必要条件

互斥条件: 一个资源每次只能被一个执行流使用。
请求与保持条件: 一个执行流因请求资源而阻塞时,对已获得的资源保持不放。
不剥夺条件 :?? 一个执行流已获得的资源,在末使用完之前,不能强行剥夺。
循环等待条件 :?? 若干执行流之间形成一种头尾相接的循环等待资源的关系。

2,避免死锁

破坏死锁的四个必要条件:
互斥条件:我们可以通过其他方法解决
请求与保持条件: 如果我们申请锁多次失败,就将自身拥有的锁释放,让其他线程竞争。
加锁顺序一致
避免锁未释放的场景
资源一次性分配
避免死锁算法:
死锁检测算法 ( 了解 )
银行家算法(了解)

二,条件变量?

思考:我们有了互斥量(锁)之后,线程可以通过锁串行的访问临界资源,中间是否存在什么问题??

问题1:线程访问临界资源需要申请锁,申请锁后需要先检测临界资源是否就绪,无非就两种情况:情况一,就绪,访问;情况二,不就绪,释放锁,再次竞争锁。这会导致线程一直忙着竞争锁,释放锁,进而导致性能下降。(访问临界资源,先申请锁,后检测资源是否就绪,而检测资源本身也是访问临界资源,所以:检测资源一定在加锁与解锁之间)

问题2:引发出线程竞争锁的不平衡问题。?互斥量(锁)的方式解决了共享资源安全性的问题,但由于多线程竞争锁的随机性导致锁的分配不均,进而产生某一线程迟迟未竞争到锁——饥饿问题

当一个线程互斥地访问某个变量时,它可能发现在其它线程改变状态之前,它什么也做不了。
例如:一个线程访问队列时,发现队列为空,它只能等待,只到其它线程将一个节点添加到队列中。这种情况就需要用到条件变量。

同步概念与竞态条件

同步:在保证数据安全的前提下,让线程能够按照某种特定的顺序访问临界资源,从而有效避免 饥饿问题 ,叫做同步。同步让线程竞争锁有了先来后到的顺序, 配合锁一同控制线程访问临界资源。
竞态条件:多个线程在访问共享资源时,由于执行顺序的不确定性(执行操作的原子性以及CPU调度情况)导致出现的问题。竞态条件可能会导致数据不一致或者程序出现错误的情况。

条件变量——初始化

这个可以类比互斥量,两种初始化方法。

静态初始化?

?pthread_cond_t? ? ?pc? ?=? PTHREAD_COND_INITIALIZER;? ? //??定义全局条件变量

静态全局锁我们不需要销毁。

动态初始化

int pthread_cond_init(pthread_cond_t *restrict cond,? const pthread_condattr_t *restrict attr);
参数: cond:要初始化的条件变量;? ? attr: NULL

通过条件变量函数初始化的,需要我们在生命周期结束时,进行手动销毁。

pthread_cond_destroy (销毁)

int pthread_cond_destroy(pthread_cond_t *cond)

pthread_cond_wait? (等待条件满足)

int pthread_cond_wait(pthread_cond_t *restrict cond,pthread_mutex_t *restrict mutex);
参数: cond:要在这个条件变量上等待; mutex:互斥量,后面详细解释。
线程先阻塞在pthread_cond_wait中,并将该线程加入条件变量队列中,等待唤醒;等到被唤醒时,再次竞争锁,竞争成功后再次判断并访问临界资源。
为什么pthread_ cond_ wait 需要互斥量(锁)?
1,条件等待是线程间同步的一种手段,如果只有一个线程,条件不满足,一直等下去都不会满足,所以必须要有一个线程通过某些操作,改变共享变量,使原先不满足的条件变得满足,并且友好的通知等待在条件变量上的线程。
2,条件不会无缘无故的突然变得满足了, 必然会牵扯到共享数据的变化(理解!) 。所以一定要用互斥锁来保护。没有互斥锁就无法安全的获取和修改共享数据。

pthread_cond_signal (唤醒线程)

int pthread_cond_signal(pthread_cond_t *? cond);
功能:唤醒条件变量队列中的头线程。

phread_cond_broadcast (广播线程)

int pthread_cond_broadcast(pthread_cond_t *? ?cond);

功能: 一次性唤醒,在条件变量队列中的所有线程。

实践:

#define NUM 3

volatile bool quit = false;

typedef void (*func_t)(const string&, pthread_mutex_t* mtx, pthread_cond_t* cond); 

void func1(const string& str, pthread_mutex_t* mtx, pthread_cond_t* cond)
{
      while (!quit)
      {
         pthread_mutex_lock(mtx);
         if (!quit)
         pthread_cond_wait(cond, mtx);
         cout << str << " running --a" << endl;
         pthread_mutex_unlock(mtx);
      }     
}

void func2(const string& str, pthread_mutex_t* mtx, pthread_cond_t* cond)
{
      while (!quit)
      {
         pthread_mutex_lock(mtx);
         if (!quit)
         pthread_cond_wait(cond, mtx);
         cout << str << " running --b" << endl;
         pthread_mutex_unlock(mtx);
      }     
}

void func3(const string& str, pthread_mutex_t* mtx, pthread_cond_t* cond)
{
      while (!quit)
      {
         pthread_mutex_lock(mtx);
         if (!quit)
         pthread_cond_wait(cond, mtx);
         cout << str << " running --c" << endl;
         pthread_mutex_unlock(mtx);
      }
}

class thread_Data
{
    public:
    thread_Data(const string& pt_name, func_t fc, pthread_mutex_t* mtx, pthread_cond_t* cond)
    : _pth_name(pt_name), _fc(fc), _mtx(mtx), _cond(cond) 
    {}

   string _pth_name; 
   func_t _fc;
   pthread_mutex_t* _mtx;
   pthread_cond_t* _cond;
};

void* func(void* argc)
{
   thread_Data* tmp = (thread_Data*)argc;
   tmp->_fc(tmp->_pth_name, tmp->_mtx, tmp->_cond);
   delete tmp;
}


int main()
{
   pthread_mutex_t mtx;
   pthread_cond_t cond;
   pthread_mutex_init(&mtx,nullptr);
   pthread_cond_init(&cond,nullptr);

    pthread_t pth[NUM];
    func_t  fun[3] = {func1, func2, func3};
    for (int i = 0; i < NUM; i++)
    {
        string name("thread ");
        name += to_string(i + 1);
        thread_Data* tmp = new thread_Data(name, fun[i], &mtx, &cond);
        pthread_create(pth + i, nullptr, func, (void*)tmp);
    }
   
   int n = 10;
   while (n--)
   {
      cout << "the main signal start running " << endl;
    //  pthread_cond_signal(&cond);
      pthread_cond_broadcast(&cond);
      sleep(1);
   }
   
   quit = true;
   pthread_cond_broadcast(&cond); // 主线程重新唤醒一次,在quit状态改变前进入阻塞的线程,让新线程判断quit一次

    for (int i = 0; i < NUM; i++)
    {
        pthread_join(pth[i], nullptr);
    }

   pthread_mutex_destroy(&mtx);
   pthread_cond_destroy(&cond); 
    return 0;
}

?条件变量使用规范

pthread_mutex_lock(&mutex);
while (条件为假)
{
   pthread_cond_wait(cond, mutex);
   // 修改条件
}
pthread_mutex_unlock(&mutex);

pthread_cond_wait本质上还是函数调用,函数调用总会有失败的时候。如果按照if 只判断一次,万一wait没有阻塞住线程,线程就会进行异常操作,所以对条件判断得用while语句,100%能阻塞住线程

那为什么使用条件变量??

回答条件变量小节刚开始的问题:?

  1. 有了条件变量后,让申请锁的线程,先等待,检测到资源就绪后再唤醒,这样就解决了问题1。
  2. 有了条件变量后,线程访问临界资源有特定的顺序(访问队列),这样就解决了问题2。

这里留下2个疑问:

1. 条件满足后,将唤醒线程——如何检测到条件是否满足?

2. 在条件变量加入后,mutex(锁)的意义又发生了什么变化?

三,生产消费者模型

为何要使用生产者消费者模型 生产者消费者模式就是通过一个容器来解决生产者和消费者的强耦合问题。生产者和消费者彼此之间不直接通讯,而通过阻塞队列来进行通讯,所以生产者生产完数据之后不用等待消费者处理,直接扔给阻塞队列,消费者不找生产者要数据,而是直接从阻塞队列里取,阻塞队列就相当于一个缓冲区,平衡了生产者和消费者的处理能力。这个阻塞队列就是用来给生产者和消费者解耦的。

?我们用超市的例子,来理解生产消费者模型:

代码实践:自己象征性的实现一个阻塞队列,一个生产者,一个消费者。

// BlockQueue.hpp
#pragma once
#include <iostream>
#include <queue>
#include <unistd.h>
#include <pthread.h>
#define defigDefualtCap 10

template <class T> 
class BlockQueue
{
private:
   // 阻塞队列是否已满
   bool isfull()
   {
      return !(_que.size() < _capacity);
   }
   
   // 阻塞队列是否为空
   bool isempty()
   {
      return _que.size() == 0;
   }

public:
   BlockQueue(int capacity = defigDefualtCap)
      :_capacity(capacity)
   {
     pthread_mutex_init(&_mtx,nullptr);
     pthread_cond_init(&_empty,nullptr);
     pthread_cond_init(&_full, nullptr);
   }
   
   ~BlockQueue()
   {
    pthread_mutex_destroy(&_mtx);
    pthread_cond_destroy(&_empty);
    pthread_cond_destroy(&_full);
   }  

   int push(const T& in)
   {
      pthread_mutex_lock(&_mtx);
      if (isfull())  // 检测阻塞队列是否未满,满了就先阻塞到,条件变量为队列满的队列中
         pthread_cond_wait(&_full, &_mtx);
      // 这里锁的意义:队列满,push操作陷入阻塞,同时自动释放锁;等到下次,被唤醒时,自动申请到锁,继续push
      _que.push(in);  // 输入后唤醒客户读取数据
      if (_que.size() >= (_capacity / 2))
      pthread_cond_signal(&_empty);
      pthread_mutex_unlock(&_mtx);
      return 0;
   }
   
   int pop(T& a)
   {
      pthread_mutex_lock(&_mtx);
      if (isempty())
      {
         pthread_cond_signal(&_full); 
         pthread_cond_wait(&_empty, &_mtx);
      }
      a = _que.front();
      _que.pop();
      pthread_mutex_unlock(&_mtx);
      // pthread_cond_signal(&_full); 
      return 0;
   }
   
private:
    std::queue<T> _que;   // 阻塞队列
    int _capacity;   // 队列值咯
    pthread_mutex_t _mtx;
    pthread_cond_t  _empty; // 为什么要使用2个条件变量,这不代表要2个
    pthread_cond_t _full;
};

// ConPor.cxx

#include "BlockQueue.hpp"
void* costomer(void* arg)
{
    BlockQueue<int>* clint = (BlockQueue<int>*)arg;
    while (1)
    {
        int a;
        clint->pop(a);
        std::cout << "消费一个:" << a << std::endl;
    }
    
}
void* producter(void* arg)
{
    BlockQueue<int>* product = (BlockQueue<int>*)arg;
    int a = 1;
    while (1)
    {
        product->push(a);
        std::cout << "生产一个: " << a << std:: endl;
        a++;
        sleep(1);
    }
}
int main()
{
    // 先完成单对单的 生产者,消费者
    pthread_t a, b;
    BlockQueue<int> BQ;
    pthread_create(&a, nullptr, costomer, (void*)&BQ);
    pthread_create(&b, nullptr, producter, (void*)&BQ);

    pthread_join(a, nullptr);
    pthread_join(b, nullptr);

    return 0;
}

思考生产消费者模型的效率提升,不仅仅是生产者将数据拷贝到缓冲区;消费者从缓冲区获取数据,以及并发效率提升,我们知道在消费者获取到商品(数据)后,需要时间将数据进行处理,而这时生产端在允许的情况下,可以一直生产,这样并发的效率优势就显现出来了。

如果生产与消费时间长,我们可以通过多生产多消费提高效率。如果生产时间短,消费时间短,就不一定需要多生产,因为调度时间占比就比较大,效率下降?。

这里就利用超市——生产消费者模型的例子,回答上面的例子:

1. 条件满足后,将唤醒线程——如何检测到条件是否满足?

答:假设是,消费者进入缓冲区发现数据还未加载,随后阻塞住,并唤醒生产者开始生产数据;当生产者生产完成后,条件满足,就可以唤醒消费者。总之,检测条件的必然不是角色自己本身,是其他资源供应角色的唤醒。

2. 在条件变量加入后,mutex(锁)的意义又发生了什么变化?

答:具体来说,当使用条件变量时,线程在等待条件变量时会释放mutex,这样其他线程就可以获得mutex并访问共享资源。而当条件满足时,唤醒线程会重新获取mutex,然后再次检查条件,这样就能确保在修改条件和唤醒等待线程之间的操作是原子的,从而避免了竞争条件的发生。

因此,引入条件变量后,mutex不仅用于保护共享资源,还用于协调线程的等待和唤醒过程,确保线程在等待和唤醒时能够正确地访问共享资源

四,POSIX信号量

POSIX 信号量和 SystemV 信号量作用相同,都是用于同步操作,达到无冲突的访问共享资源目的。 但 POSIX 可以用于线程间同步。

?1.理解信号量:

首先,我们曾经的场景是多个执行流,访问一个整体的共享资源。我们试想一下是否有这样的场景,这几个执行流,每个访问的是不同位置的资源,我们是否可以将整体的共享资源切成多块资源,使多执行流之间形成并发

理解信号量,举一个简单的例子:电影院例子

看电影需要买票,而买票的本质:资源(座位)的预定。而信号量就是里面的票数,申请票数就票数--(信号量--,管他叫:P操作);反之++(叫: V操作),在票数为0时,无法在申请电影票。

问:如何知道资源的个数,以及剩余多少??(信号量剩余多少的准确性,由信号量的P,V原子性保证)并且能保证这个资源是我该拥有的呢?(信号量预定)

2. 接口

初始化信号量

#include <semaphore.h>
int sem_init(sem_t *sem, int pshared, unsigned int value);
参数:
pshared:0 表示线程间共享,非零表示进程间共享。
value :信号量初始值

销毁信号量

?int sem_destroy(sem_t *sem);

等待信号量(P操作——原子性)

功能:等待信号量,会将信号量的值 1?
int sem_wait(sem_t *sem);

发布信号量(V操作——原子性)

int sem_post(sem_t *sem);
功能:发布信号量,表示资源使用完毕,可以归还资源了。将信号量值 1

3. 重写生产消费者模型

上一节生产者 - 消费者的例子是基于 queue , 其空间可以动态分配 , 现在基于固定大小的环形队列重写这个程序(POSIX 信号量) :??
基于 环形队列的生产消费模型 , 环形队列采用数组模拟,用模运算来模拟环状特性。
环形结构起始状态和结束状态都是一样的,不好判断为空或者为满,我们目前有两种方法解决:
1. 计数器法。
2. 预留一个单位空间作为满的状态。
但是我们现在有信号量这个计数器,就很简单的进行多线程间的同步过程。我们简单画一个草图,来规划我们需要实现的目标,以及可以遇见的问题。

RingQueue.hpp

#ifndef __RING_QUEUE_
#define __RING_QUEUE_

#include <iostream>
#include <vector>
#include "sem_num.hpp"

#define _default_queue_size 10

template <class T>
class RingQueue
{
public: 
   RingQueue(const int Num = _default_queue_size)
      :ringqueue(Num)
      ,_num(Num)
      ,c_step(0)
      ,p_step(0)
      ,space_sem(_default_queue_size)
      ,data_sem(0)
   {}

   ~RingQueue()
   {}

   void push(const T& data)
   {
         //生产者循环输入资源
         space_sem.P();  // 空间资源--

         ringqueue[p_step++] = data;
         p_step %= _num;
         data_sem.V();  // 信号量资源++
   }

   void pop(T& data)
   {
         //消费者循环获取数据
         data_sem.P();
         data = ringqueue[c_step++];
         c_step %= _num;
         space_sem.V();
   }

private: 
    std::vector<T> ringqueue;
    int _num;    // 记录圆环长度
    int c_step;  //消费者所在下标值
    int p_step;  //生产者所在下标值
    SemNum space_sem;  // 空间资源信号量,给生产者
    SemNum data_sem;   // 数据资源信号量, 给消费者
};

#endif

sem_num.hpp

#ifndef __SAM_NUM_
#define __SAM_NUM_

#include <iostream>
#include <semaphore.h>
class SemNum
{
public:
   SemNum(const int value)
   {
    sem_init(&sem, 0, value);
   }
   ~SemNum()
   {
     sem_destroy(&sem);
   }
   void P()
   {
     sem_wait(&sem);
   }
   void V()
   {
     sem_post(&sem);
   }
private:
    sem_t sem; 
};


// main函数
#include "RingQueue.hpp"
#include <time.h>
#include <unistd.h>
void* costomer(void* args)
{
    RingQueue<int>* RQ = (RingQueue<int>*)args;
    while (1)
    {
        int data = -1;
        RQ->pop(data);
        std::cout << "已销售: " << data << std::endl; // " 线程ID: " << pthread_self() << std::endl; 
    }         
}

void* porducer(void* args)
{
    RingQueue<int>* RQ = (RingQueue<int>*)args;
    while (1)
    {
        int data = rand() % 1000 + 1;
        std::cout << "已生产: " << data << std::endl; // " 线程ID: "<< pthread_self() << std::endl;
        
        RQ->push(data);
    } 
}

int main()
{
    pthread_t p, c;
    srand(time(0) * 23 ^ 0Xeeee);
    RingQueue<int> RQ;    
    pthread_create(&p,nullptr, porducer, (void*)&RQ);
    pthread_create(&c,nullptr, costomer, (void*)&RQ);
    pthread_join(c,nullptr);
    pthread_join(p,nullptr);
    return 0;
}

简单的生产消费模型已经差不多了,现在我们尝试实现多生产,多消费。

之前是单生产单消费,我们转变为多生产多消费,就是多了生产与生产之间及消费与消费之间两个关系。生产与生产,消费与消费的共享资源就是对下标的修改,也是我们需要保护的地方。精华修改如下:

 void push(const T& data)
   {
         //生产者循环输入资源
         space_sem.P();  // 空间资源--
         pthread_mutex_lock(&p_lock);
         ringqueue[p_step++] = data;
         p_step %= _num;
         pthread_mutex_unlock(&p_lock);
         data_sem.V();  // 信号量资源++
   }

   void pop(T& data)
   {
         //消费者循环获取数据
         data_sem.P();
         pthread_mutex_lock(&c_lock);
         data = ringqueue[c_step++];
         c_step %= _num;
         pthread_mutex_unlock(&c_lock);
         space_sem.V();
   }

这里我们有一个需要讨论的问题:

(1). 为什么先申请信号量,后申请锁?

答:? 1. 锁覆盖的串行区域,应尽量的短小; 2. 申请信号量,本身是原子操作,与条件变量不同,不用担心信号量的数据安全。

(2). 这里,多生产多消费的意义?

答:生产者拿到数据以及消费者处理数据本身是最废时间的,这样体现出多生产多消费在特定情况下的并发优势

生产者的本质:私人任务? ?——>? ?公共空间中

消费者的本质:公共空间中的任务——>? 私人任务

(3). 信号量本身是一个计数器,那计数器的意义?

答:曾经生产消费者模型:加锁——> 检测(条件变量),访问 ——> 解锁 ;在没有访问临界资源前,我们无法得知资源就绪情况。条件变量减少了不必要锁的申请,但仍需要在临界资源中的检测

信号量,是提前预知资源情况,而且在PV操作中,提前在外部得知临界资源的变化情况

下期:网络编程!!

结语

? ?本小节就到这里了,感谢小伙伴的浏览,如果有什么建议,欢迎在评论区评论,如果给小伙伴带来一些收获请留下你的小赞,你的点赞和关注将会成为博主创作的动力

文章来源:https://blog.csdn.net/qq_72112924/article/details/135270697
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。