Python定时任务APScheduler

APScheduler定时任务

APScheduler 支持三种调度任务:固定时间间隔,固定时间点(日期),Linux 下的 Crontab 命令。同时,它还支持异步执行、后台执行调度任务。

一、基本架构

触发器 triggers:设定触发任务的条件

描述一个任务何时被触发,按日期或按时间间隔或按 cronjob 表达式三种方式触发

任务存储器 job stores:存放任务,可以放内存(默认)或数据库

注:调度器之间不能共享任务存储器

执行器 executors:用于执行任务,可设定执行模式

将指定的作业提交到线程池或者进程池中运行,任务完成通知调度器触发相应的事件。

调度器 schedulers:将上方三个组件作为参数,创建调度器实例执行。

协调三个组件的运行。

二、调度器组件(schedulers)

BlockingScheduler阻塞式调度器

调度程序是进程中唯一运行的进程,调用start函数会阻塞当前线程,不能立即返回。

from apscheduler.schedulers.blocking import BlockingScheduler import time scheduler = BlockingScheduler() def job1(): print "%s: 执行任务" % time.asctime() scheduler.add_job(job1, 'interval', seconds=3) scheduler.start()

BackgroundScheduler后台调度器

当前线程不会阻塞,调度器后台执行

from apscheduler.schedulers.background import BackgroundScheduler import time scheduler = BackgroundScheduler() def job1(): print "%s: 执行任务" % time.asctime() scheduler.add_job(job1, 'interval', seconds=3) scheduler.start() time.sleep(10)

注:10秒执行完后,程序结束。

AsyncIOSchedulerAsyncIO调度器

适用于使用了asyncio的情况

from apscheduler.schedulers.asyncio import AsyncIOScheduler import asyncio ... ... try: asyncio.get_event_loop().run_forever() except (KeyboardInterrupt, SystemExit): pass

GeventSchedulerGevent调度器

使用了Gevent的情况

from apscheduler.schedulers.gevent import GeventScheduler ... ... g = scheduler.start() try: g.join() except (KeyboardInterrupt, SystemExit): pass

TornadoSchedulerTornado调度器

适用于构建Tornado应用

TwistedScheduler Twisted调度器

适用于构建Twisted应用

QtScheduler Qt调度器

适用于构建Qt应用

三、触发器组件(trigger)

date:只在某个时间点执行一次,具体日期

run_date(datetime|str)

scheduler.add_job(my_job, 'date', run_date=datetime(2019, 7, 12, 15, 30, 5), args=[]) scheduler.add_job(my_job, 'date', run_date="2019-07-12", args=[])

timezone 指定时区

interval:每隔一段时间允许一次,时间间隔

weeks=0 | days=0 | hours=0 | minutes=0 | seconds=0, start_date=None, end_date=None, timezone=None

scheduler.add_job(my_job, 'interval', hours=2) scheduler.add_job(my_job, 'interval', hours=2, start_date='2017-9-8 21:30:00', end_date='2018-06-15 21:30:00)

cron:任务的运行周期

(year=None, month=None, day=None, week=None, day_of_week=None, hour=None, minute=None, second=None, start_date=None, end_date=None, timezone=None)

除了week和 day_of_week,它们的默认值是*

例如day=1, minute=20,这就等于year='*', month='*', day=1, week='*', day_of_week='*', hour='*', minute=20, second=0,工作将在每个月的第一天以每小时20分钟的时间执行

表达式类型

表达式参数类型描述
*   所有   通配符。例:minutes=*即每分钟触发  
*/a   所有   可被a整除的通配符。  
a-b   所有   范围a-b触发  
a-b/c   所有   范围a-b,且可被c整除时触发  
xth y     第几个星期几触发。x为第几个,y为星期几  
last x     一个月中,最后个星期几触发  
last     一个月最后一天触发  
x,y,z   所有   组合表达式,可以组合确定值或上方的表达式  

注:当设置的时间间隔小于,任务的执行时间,线程会阻塞住,等待执行完了才能执行下一个任务,可以设置max_instance指定一个任务同一时刻有多少个实例在运行,默认为1

四、配置调度器

线程池执行器默认为10,内存任务存储器为memoryjobstore,如果想自己配置的话可以执行以下操作

需求:

两个任务储存器分别搭配两个执行器;同时,还要修改任务的默认参数;最后还要改时区

名称为“mongo”的MongoDBJobStore

名称为“default”的SQLAlchemyJobStore

名称为“ThreadPoolExecutor ”的ThreadPoolExecutor,最大线程20个

名称“processpool”的ProcessPoolExecutor,最大进程5个

UTC时间作为调度器的时区

默认为新任务关闭合并模式()

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/d8f2496ad1b6159b199d9d9d17a86413.html