celery介绍

目录

官方

架构: 

 celery 是独立的服务

celery包结构

 celery执行异步任务,延时任务,定时任务

异步任务

 延时任务

 定时任务

 django 使用celery

秒杀逻辑

双写一致性


官方

Celery 官网:Celery - Distributed Task Queue — Celery 5.2.7 documentation

Celery 官方文档英文版:Celery - Distributed Task Queue — Celery 5.3.0b1 documentation

Celery 官方文档中文版:Celery - 分布式任务队列 — Celery 3.1.7 文档

Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统

1. 完成异步任务:可以提高项目的并发量,以前用多线程实现项目的并发量,现在可以使用celery来做

2. 完成延时任务

3. 完成定时任务

架构: 

消息中间件:  broker 提交的任务【函数】都放在这里, celery本身不能提供消息中间件,需要借助于第三方: redis, rabbitmq

任务执行单元: worker,是真正执行任务的的地方, 一个个进程中执行函数

结果存储: backend, 函数return的结果都存储在这里, celery本身不提供结果存储,需要借助于第三方: redis 数据库, rabbitmq

 celery 是独立的服务

1, 可以不依赖任何服务器,通过自身命令来启动服务

2, celery服务为为其他项目服务提供一部解决任务的需求’  ## 会有两个服务同时运行,一个是项目服务,一个是celery服务, 项目服务讲需要异步处理的任务交给celery服务 , celery就会在需要时一步完成项目的需求

安装

psi3 install celery

使用步骤

1, 写一个main.py: 实例化得到app对象, 写函数,任务,注册成celery的任务, 

2, 在别的程序中提交任务》》》提交到broker中去  add.delay(3,4)

 执行异步任务

add.apply_asyn()

add.delay()

 main.py

import time

from celery import Celery

backend = 'redis://127.0.0.1:6379/1'
broker = 'redis://127.0.0.1:6379/0'

app = Celery('test',backend=backend,broker=broker)
# 以上实例化得到对象

# 写任务
@app.task
def add(a,b):
    time.sleep(3)
    print(a+b)
    return a+b

s1.py


from main import add

print('good evening')
# 执行的时同步任务
res = add(3,4)
print(res)


# 3 执行异步任务
# add.apply_async()

print(add.delay(2, 7))   # 74523b46-68a5-4429-b061-723ccf3f9b82
print(add.delay(7, 5))   # 25e9b218-55ff-4a0a-a41f-76cde3ff8833

s2.py


def outer(func):
    def inner(*args,**kwargs):
        res = func(*args,**kwargs)
        return res
    inner.delay='xxx'
    return inner

@outer
def add():
    print('aaa')

#
# add.name='yietong'
print(add.delay)



3, 启动worker, 从broker中去任务执行,执行完放到backend中

	    win:    
        	celery worker -A main -l info -P eventlet  # 4.x及之前用这个 
            celery -A main worker -l info -P eventlet  # 5.x及之后用这个
        lin,mac: 
            celery worker -A main -l info
        	celery -A main worker -l info

 eventlet模块需要安装  pip3 install eventlet

4, 在backend 中查看任务执行的结果

直接看或者通过代码查看

from main import app
from celery.result import AsyncResult
id = '5f7bbf70-9946-4085-b993-f5b8a8d0bd11'
if __name__ == '__main__':
    res = AsyncResult(id=id,app=app)
    if res.successful():
        result = res.get()
        print(result)   # 12
    elif res.failed():
        print('任务失败')
    elif res.status == 'PENDING':
        print('任务正在等待中')
    elif res.status== 'STATED':
        print('任务已经开始被执行')

停掉worker后

 重启服务后

celery包结构

项目  

 celery_task【包】
            -__init__.py
            -celery.py
            -user_task.py
            -home_task.py
        add_task.py
        get_result.py

写一个celery包,以后在任意项目中需要使用的时候把包copy进去,导入使用即可。

使用步骤;

  •  新建包: celery_task
  • 在包里先新建一个celery.py
  • 初始化app
import celery
from celery import Celery

app = celery.Celery()



backend = 'redis://127.0.0.1:6379/1'
broker = 'redis://127.0.0.1:6379/0'
#  一定不要忘了include
app = Celery(__name__,broker=broker,backend=backend,include=['celery_task.home_task','celery_task.user_task'])
  • 在包里新建user_task.py 编写用户相关任务
import time

from .celery import app

@app.task
def send_sms(mobile,code):
    time.sleep(1)
    print('短信发送成功:%s,验证码是%s'%(mobile,code))
    return True
  • 在包里新建home_task.py 编写首页相关任务
import time

from .celery import app

@app.task
def add(a,b):
    time.sleep(3)
    print('计算结果时%s'%(a+b))
    return a+b

  • 其他程序提交任务

  • 启动worker》》》它可以先启动【在提交任务之前】》》》cd 到包所在的目录下
celery -A celery_task worker -l info -P eventlet
  • 查看任务执行的结果

 get_result.py

from celery_task.celery import app
from celery.result import AsyncResult

def get(task_id):
    asy = AsyncResult(id=task_id, app=app)
    if asy.successful():
        res = asy.get()
        print('任务执行结果:', res)
    elif asy.failed():
        print('任务失败')
    elif asy.status == 'PENDING':
        print('任务等待中被执行')
    elif asy.status == 'RETRY':
        print('任务异常后正在重试')
    elif asy.status == 'STARTED':
        print('任务已经开始被执行')

if __name__ == '__main__':
    # 任务id,提交任务时返回的结果
    task_id = 'bb52fd1a-43e6-4c36-852c-9b1c940a1ad7'
    get(task_id)

 celery执行异步任务,延时任务,定时任务

异步任务

task.delay(*args,**kwargs)

 延时任务

task.apply_async(args=[参数,参数],eta=时间对象(utc时间))
"""
参数
    args:任务需要的参数
    countdown:几秒后执行
    retry:任务失败是否重试,默认为True
其他参数:
	eta:时间对象
"""
from celery_task.home_task import add


# 提交一个add的异步任务
#eta 是一个时间任务。 要写一个5秒后的时间对象
from datetime import datetime,timedelta
# 得到10miao后的时间,celery 默认使用utc时间
eta = datetime.utcnow()+timedelta(seconds=10)
res = add.apply_async(args=(200,20),eta=eta)
print(res)  # 9d609f6f-4d08-4b62-999c-a9466d3819e5

 定时任务

  -1 app的配置文件中配置 ,写在celery.py中

           
        	app.conf.beat_schedule = {
                'send_sms_task': {
                    'task': 'celery_task.user_task.send_sms',
                    'schedule': timedelta(seconds=5),
                    # 'schedule': crontab(hour=8, day_of_week=1),  # 每周一早八点
                    'args': ('1897334444', '7777'),
                },
                'add_task': {
                    'task': 'celery_task.home_task.add',
                    'schedule': crontab(hour=12, minute=10, day_of_week=3),  # 每周一早八点
                    'args': (10, 20),
                }
            }

    -2 启动worker :干活的人
          

 celery -A celery_task worker -l info -P eventlet


        -3 启动beat :提交任务的人
         

   celery -A celery_task beat -l info

# 设置时区
app.conf.timezone ='Asia/Shanghai'
# 是否使用utc时间
app.conf.enable_utc = False

from celery.schedules import crontab
# app的配置信息
app.conf.beat_schedule = {
                'send_sms_task': {
                    'task': 'celery_task.user_task.send_sms',
                    'schedule': timedelta(seconds=5),
                    # 'schedule': crontab(hour=8, day_of_week=1),  # 每周一早八点
                    'args': ('18595992917', '7777'),
                },
                'add_task': {
                    'task': 'celery_task.home_task.add',
                    'schedule': crontab(hour=22, minute=10, day_of_week=3),  # 每周一早八点
                    'args': (10, 20),
                }
            }

补充:

如果公司只想做定时任务, celery比较大,比较麻烦,一般公司会使用 pip install apscheduler

   # 每隔多长事件 
   import time
    from apscheduler.schedulers.blocking import BlockingScheduler
	# 任务
    def my_job(i):
        print (i)
    sched = BlockingScheduler()
    sched.add_job(my_job, 'interval', seconds=5,values=['学会了'])
    
    ## 按年月日
    import datetime
    from apscheduler.schedulers.blocking import BlockingScheduler
    scheduler = BlockingScheduler()
    def my_job(text):
        print(text)
    # datetime类型(用于精确时间)
    scheduler.add_job(my_job, 'date', run_date=datetime(2022, 4, 25, 17, 30, 5), args=['测试任务'])
    
    ## 按corn
    import datetime
	from apscheduler.schedulers.background import BackgroundScheduler
    def job_func(text):
        print("当前时间:", datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S.%f")[:-3])

    scheduler = BackgroundScheduler()
    # 在每年 1-3、7-9 月份中的每个星期一、二中的 00:00, 01:00, 02:00 和 03:00 执行 job_func 任务
    scheduler .add_job(job_func, 'cron', month='1-3,7-9',day='0, tue', hour='0-3')
    
    

 django 使用celery

使用步骤:

   1 把写好的包(celery_task)复制到项目路径下
    2 在包内的celery.py 的上面加入代码

        import os
        os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'luffy_api.settings.dev')
        import django
        django.setup()


   3 在django的视图类中,导入,提交任务

任务.delay()
任务.apply_async()


    4 启动worker,beat

celery -A celery_task worker -l info -P eventlet


celery -A celery_task beat -l info

celery 实现定时更新缓存

双写一致性

redis双写一致性指的是redis和数据库的数据要同时更新

我们都知道把数据库的数据暂存与redis,之后取数据都去redis中去, 这样就可以减少时间消耗,但是会出现一个问题, 数据库更i轩尼诗,redis没有更新,使用取数据取到的还是原来的值。

首先要了解数据库的数据是什么时候存到redis中的

一般来说, 前端发送Ajax请求,会先从redis中取,如果有值,则直接返回,如果没有值,就从数据库中取值并保存到redis中。

使用根据以上流程有以下解决办法

1. 先更新数据库,在更新缓存

2, 先删除缓存,在更新数据库

3,先更新数据库,在删除缓存(这种比较多)

4,定时更新缓存(隔5分钟更新一次)

定时更新缓存

视图类

class BannerView(GenericViewSet, ListModelMixin):
    queryset = models.Banner.objects.all()
    serializer_class = serializer.BannerSerializer

    def list(self, request, *args, **kwargs):
        banner_list = cache.get('banner_list')
        if banner_list:
            # redis中有值直接返回
            return Response(banner_list)
        else:
            # redis中没有值,获取数据再存入redis
            res = super(BannerView, self).list(request, *args, **kwargs)
            cache.set('banner_list', res.data)
            return res

celery.py

from celery import Celery
import os

os.environ.setdefault("DJANGO_SETTINGS_MODULE", "luffyapi.settings.dev")
import django

django.setup()

broker = 'redis://127.0.0.1:6379/2'
backend = 'redis://127.0.0.1:6379/3'
include = [
    'celery_task.tasks'
]

app = Celery('main', broker=broker, backend=backend, include=include)
from datetime import timedelta

app.conf.beat_schedule = {
    'banner_update': {
        'task': 'celery_task.tasks.banner_update',  # 任务路径
        'schedule': timedelta(seconds=10),  # 定时
        'args': (),  # 任务参数
    }
}

任务

@app.task
def banner_update():
    query_set = models.Banner.objects.all()
    ser = serializer.BannerSerializer(instance=query_set, many=True)
    cache.set('banner_list', ser.data)
    return True

秒杀逻辑

前端使用秒杀按钮, 

事件: 像后端秒杀接口发送请求, 发送完立马起一个定时任务, 每隔5秒,像后端查看一下是否秒杀成功, 如果没成功,定时任务继续执行, 如果成功,清空定时任务。

    handleClick() {
      this.$axios.get(this.$settings.BASE_URL + 'userinfo/seckill/').then(res => {
        if (res.data.code == 100) {
          let task_id = res.data.id
          this.$message({
            message: res.data.msg,
            type: 'error'
          });
          // 起个定时任务,每隔5s向后端查询一下是否秒杀成功
          let t = setInterval(() => {
            this.$axios.get(this.$settings.BASE_URL + 'userinfo/get_result/?id=' + task_id).then(
                res => {
                  if (res.data.code == 100 || res.data.code == 101) {  //秒杀结束了,要么成功,要么失败了
                    alert(res.data.msg)
                    // 销毁掉定时任务
                    clearInterval(t)
                  } else if (res.data.code == 102) {
                    //什么事都不干
                  }
                }
            )
          }, 5000)


        }
      })
    }

后端: 

秒杀接口

提交秒杀任务

        def seckill(request):
            # 提交秒杀任务
            res = seckill_task.delay()
            return JsonResponse({'code': 100, 'msg': '正在排队', 'id': str(res)})

查询是否秒杀成功的接口  【根据用户传入的id,查询任务是否成功】

        def get_result(request):
            task_id = request.GET.get('id')
            res = AsyncResult(id=task_id, app=app)
            if res.successful():
                result = res.get()  # 7
                return JsonResponse({'code': 100, 'msg': str(result)})
            elif res.failed():
                print('任务失败')
                return JsonResponse({'code': 101, 'msg': '秒杀失败'})
            elif res.status == 'PENDING':
                print('任务等待中被执行')
                return JsonResponse({'code': 102, 'msg': '还在排队'})
            

 

双写一致性

接口增加缓存

首页轮播图接口增加缓存, 提高了接口的响应速度,提高并发量

class BannerView(GenericViewSet, CommonListModelMixin):
    queryset = Banner.objects.all().filter(is_delete=False, is_show=True).order_by('orders')[:settings.BANNER_COUNT]
    serializer_class = BannerSerializer

    def list(self, request, *args, **kwargs):
        result = cache.get('banner_list')
        if result:  # 缓存里有
            print('走了缓存,速度很快')
            return APIResponse(result=result)
        else:
            # 去数据库拿
            print('走了数据库,速度慢')
            res = super().list(request, *args, **kwargs)
            result = res.data.get('result')  # {code:100,msg:成功,result:[{},{}]}
            cache.set('banner_list', result)
            return res

加了缓存,如果MySQL数据库变了,由于请求的都是缓存的数据,导致MySQL和redis的数据不一致, 这就涉及到了双写一致性的问题

1, 修改MySQL数据库,删除缓存,

2, 修改数据库,修改缓存

3, 定时更新缓存  》》  针对实时性不是很高的接口适合定时更新

给首页轮播图接口加了缓存,出现了双写一致性问题, 使用定时更新来解决双写一致性的问题【会存在不一致的情况,可以忽略】 使用celery定时任务

home_task.py

@app.task
def update_banner():
    # 更新缓存
    # 查询出现在轮播图的数据
    queryset = Banner.objects.all().filter(is_delete=False, is_show=True).order_by('orders')[:settings.BANNER_COUNT]
    ser = BannerSerializer(instance=queryset, many=True)
    # ser 中得图片,没有前面地址
    for item in ser.data:
        item['image'] = settings.HOST_URL + item['image']
    cache.set('banner_list', ser.data)
    return True

 celery.py

app.conf.beat_schedule = {
    'update_banner': {
        'task': 'celery_task.home_task.update_banner',
        'schedule': timedelta(seconds=50),
        'args': (),
    }
}

启动django, worker,beat

第一次访问: 查的数据库放入了缓存,以后再访问就走缓存。 一旦MySQL数据改了,缓存可能不一致。 定时更新,保持了一致

补充:

@app.task 与@shared.task的区别

他俩的作用一样, 第一个需要执行app, 第二个直接导入使用, 直接从内存中取出来app对象