在日常工作中,常常会用到需要周期性执行的任务,一种方式是采用 Linux 系统自带的 crond 结合命令行实现。另外一种方式是直接使用Python。
当每隔一段时间就要执行一段程序,或者往复循环执行某一个任务,这就需要使用定时任务来执行程序。比如在实现对某个目标进行爬虫的话,需要用到实时任务。
python中常用的定时任务主要有以下8中方法:
-
while True:+sleep()
-
threading.Timer定时器
-
Timeloop库执行定时任务
-
调度模块sched
-
调度模块schedule
-
任务框架APScheduler
-
分布式消息系统celery执行定时任务
-
使用windows自带的定时任务
接下来分别用上述8中方式来完成下面定义的Task()任务,示例代码如下:
from datetime import datetime
def task():
now = datetime.now()
ts = now.strftime("%Y-%m-%d %H:%M:%S")
print(ts)
1、利用while True:+sleep()实现定时任务
最简单的方式应该就是使用time模块来实现定时任务,在循环里面放入要执行的任务,然后sleep一段时间再执行。实现令当前执行的线程暂停 n秒后再继续执行。所谓暂停,即令当前线程进入阻塞状态,当达到 sleep() 函数规定的时间后,再由阻塞状态转为就绪状态,等待 CPU 调度。
示例代码:
from datetime import datetime
import time
def task():
now = datetime.now()
ts = now.strftime("%Y-%m-%d %H:%M:%S")
print(ts)
def func():
while True:
task()
time.sleep(3)
func()
运行结果:
优缺点:只能实现同步任务,无法执行异步任务。执行起来虽然是比较简单,但不容易控制,而且sleep是个阻塞函数。只能设定间隔,不能指定具体的时间点。
2、利用threading.Timer()定时器实现定时任务
timer最基本理解就是定时器,可以启动多个定时任务,这些定时器任务是异步执行,所以不存在等待顺序执行问题。
Timer方法 | 说明 |
---|
Timer(interval, function, args=None, kwargs=None) | 创建定时器 |
cancel() | 取消定时器 |
start() | 使用线程方式执行 |
join(self, timeout=None) | 等待线程执行结束 |
示例代码:
from datetime import datetime
from threading import Timer
def task():
now = datetime.now()
ts = now.strftime("%Y-%m-%d %H:%M:%S")
print(ts)
def func():
task()
t = Timer(3, func)
t.start()
func()
运行结果:
优缺点:可以实现异步任务,是非阻塞的,但当运行次数过多时,会出现报错:Pyinstaller maximum recursion depth exceeded Error Resolution 达到最大递归深度,然后想到的是修改最大递归深度,
sys.setrecursionlimit(100000000)
但是运行到达到最大CPU时,python会直接销毁程序。
关于更多timer用法,详见博文:threading.Timer()定时器实现定时任务_IT之一小佬的博客-CSDN博客
3、使用Timeloop库执行定时任务
Timeloop是一个库,可用于运行多周期任务。这是一个简单的库,使用decorator模式在线程中运行标记函数。
示例代码:
from datetime import datetime, timedelta
from timeloop import Timeloop
tl = Timeloop()
def task():
now = datetime.now()
ts = now.strftime("%Y-%m-%d %H:%M:%S")
print(ts + '333!')
def task2():
now = datetime.now()
ts = now.strftime("%Y-%m-%d %H:%M:%S")
print(ts + "555555!")
@tl.job(interval=timedelta(seconds=2))
def sample_job_every_2s():
task()
@tl.job(interval=timedelta(seconds=5))
def sample_job_every_5s():
task2()
关于更多timeloop用法,详见博文: python中定时任务timeloop库用法详解_IT之一小佬的博客-CSDN博客
4、利用调度模块sched实现定时任务
sched是一种调度(延时处理机制)。sched模块实现了一个通用事件调度器,在调度器类使用一个延迟函数等待特定的时间,执行任务。同时支持多线程应用程序,在每个任务执行后会立刻调用延时函数,以确保其他线程也能执行。
scheduler对象主要方法:
- enter(delay, priority, action, argument),安排一个事件来延迟delay个时间单位。
- cancel(event):从队列中删除事件。如果事件不是当前队列中的事件,则该方法将跑出一个ValueError。
- run():运行所有预定的事件。这个函数将等待(使用传递给构造函数的delayfunc()函数),然后执行事件,直到不再有预定的事件。
示例代码:
import sched
import time
from datetime import datetime
# 初始化sched模块的scheduler类
# 第一个参数是一个可以返回时间戳的函数,第二个参数可以在定时未到达之前阻塞。
schedule = sched.scheduler(time.time, time.sleep)
def task(inc):
now = datetime.now()
ts = now.strftime("%Y-%m-%d %H:%M:%S")
print(ts)
schedule.enter(inc, 0, task, (inc,))
def func(inc=3):
# enter四个参数分别为:
# 间隔事件、优先级(用于同时间到达的两个事件同时执行时定序)、被调用触发的函数、给该触发函数的参数(tuple形式)
schedule.enter(0, 0, task, (inc,))
schedule.run()
func()
运行结果:
关于更多sched用法,详见博文: https://blog.csdn.net/weixin_44799217/article/details/127353545
5、利用调度模块schedule实现定时任务
schedule是一个第三方轻量级的任务调度模块,可以按照秒,分,小时,日期或者自定义事件执行时间。
如果想执行多个任务,也可以添加多个task。
示例代码:
import schedule
from datetime import datetime
def task():
now = datetime.now()
ts = now.strftime("%Y-%m-%d %H:%M:%S")
print(ts)
def task2():
now = datetime.now()
ts = now.strftime("%Y-%m-%d %H:%M:%S")
print(ts + '666!')
def func():
# 清空任务
schedule.clear()
# 创建一个按3秒间隔执行任务
schedule.every(3).seconds.do(task)
# 创建一个按2秒间隔执行任务
schedule.every(2).seconds.do(task2)
while True:
schedule.run_pending()
func()
运行结果:
优缺点:需要和while Ture配合使用,而且占用的CPU也比其他几种多的多,占用内存也是较大。
关于更多schedule用法,详见博文: https://blog.csdn.net/weixin_44799217/article/details/127352957
6、利用任务框架ASPcheduler实现定时任务
APScheduler是Python的一个定时任务框架,用于执行周期或者定时任务,该框架不仅可以添加、删除定时任务,还可以将任务存储到数据库中,实现任务的持久化,使用起来非常方便。
示例代码:
from datetime import datetime
from apscheduler.schedulers.blocking import BlockingScheduler
def task():
now = datetime.now()
ts = now.strftime("%Y-%m-%d %H:%M:%S")
print(ts)
def task2():
now = datetime.now()
ts = now.strftime("%Y-%m-%d %H:%M:%S")
print(ts + '666!')
def func():
# 创建调度器BlockingScheduler()
scheduler = BlockingScheduler()
scheduler.add_job(task, 'interval', seconds=3, id='test_job1')
# 添加任务,时间间隔为5秒
scheduler.add_job(task2, 'interval', seconds=5, id='test_job2')
scheduler.start()
func()
运行结果:
关于更多apschedule用法,详见博文:python中定时任务apscheduler库用法详解_IT之一小佬的博客-CSDN博客
7、使用分布式消息系统celery执行定时任务
Celery是一个简单,灵活,可靠的分布式系统,用于处理大量消息,同时为操作提供维护此类系统所需的工具, 也可用于任务调度。Celery 的配置比较麻烦,如果你只是需要一个轻量级的调度工具,Celery 不会是一个好选择。
Celery 是一个强大的分布式任务队列,它可以让任务的执行完全脱离主程序,甚至可以被分配到其他主机上运行。我们通常使用它来实现异步任务(async task)和定时任务(crontab)。 异步任务比如是发送邮件、或者文件上传, 图像处理等等一些比较耗时的操作 ,定时任务是需要在特定时间执行的任务。
注意:celery本身并不具备任务的存储功能,在调度任务的时候肯定是要把任务存起来的,因此在使用celery的时候还需要搭配一些具备存储、访问功能的工具,比如:消息队列、Redis缓存、数据库等。官方推荐的是消息队列RabbitMQ,有些时候使用Redis也是不错的选择。
8、使用windows自带的定时任务
略。这儿不做细述!
用Python写一个定时脚本,最简单的方案就是使用while True: + sleep()实现定时任务。
这种方法的思路是使用while循环不断检查当前时间,如果达到预设的时间点,就执行任务,然后使用sleep()函数让程序暂停一段时间,避免占用过多资源。
例如,如果你想让程序每天早上8点打印一句话,你可以写出以下代码:
定时器是Python编程中的一个重要工具,用于执行定时任务和操作。本文介绍了多种高级的定时器使用方式,包括使用threading模块、schedule库以及在异步编程中使用定时器。选择合适的方法取决于具体需求和项目的要求。无论你选择哪种方式,希望本文提供的示例代码和说明能帮助大家更好地使用定时器来管理任务和操作。
定时任务是编程中常见的需求,它可以按照预定的时间表执行特定的任务或操作。在Python中,有多种方法可以实现定时任务。本文将介绍九种常见的Python定时任务解决方案,包括使用标准库、第三方库和操作系统工具。
优缺点:可以实现异步任务,是非阻塞的,但当运行次数过多时,会出现报错:Pyinstaller maximum recursion depth exceeded Error Resolution 达到最大递归深度,然后想到的是修改最大递归深度,同时支持多线程应用程序,在每个任务执行后会立刻调用延时函数,以确保其他线程也能执行。APScheduler是Python的一个定时任务框架,用于执行周期或者定时任务,该框架不仅可以添加、删除定时任务,还可以将任务存储到数据库中,实现任务的持久化,使用起来非常方便。
在项目中,我们可能遇到有定时任务的需求。其一:定时执行任务。例如每天早上 8 点定时推送早报。其二:每隔一个时间段就执行任务。比如:每隔一个小时提醒自己起来走动走动,避免长时间坐着。今天,我跟大家分享下 Python 定时任务的实现方法。
第一种办法是最简单又最暴力。那就是在一个死循环中,使用线程睡眠函数 sleep()。
class sched.scheduler(timefunc, delayfunc)这个类定义了调度事件的通用接口,它需要外部传入两个参数,timefunc是一个没有参数的返回时间类型数字的函数(常用使用的如time模块里面的time),delayfunc应该是一个需要一个参数来调用、与timefunc的输出兼容、并且作用为延迟多个时间单位的函数(常用的如time模块的sleep)。比如,如下的工作流中,任务T1执行完成,T2和T3才能开始执行,T2和T3都执行完成,T4才能开始执行。
当每隔一段时间就要执行一段程序,或者往复循环执行某一个任务,这就需要使用定时任务来执行程序。应用很广泛,可以实现程序的自动化,而不需要我们手动的在规定时间内执行。如爬虫,如定时器等等。以下将介绍几种pyhton常用的定时任务方法。
定时任务是编程中常见的需求,它可以按照预定的时间表执行特定的任务或操作。在Python中,有多种方法可以实现定时任务。本文将介绍九种常见的Python定时任务解决方案,包括使用标准库、第三方库和操作系统工具。文末领取全套最新Python学习资源!
在Python中执行定时任务有多种方法可供选择,可以根据任务的复杂性和需求来选择合适的方法。简单的任务可以使用,而复杂的任务可以使用schedschedule或等库来处理。无论选择哪种方法,都可以轻松地自动化任务的执行,提高工作效率。希望本文的教程和示例代码能够帮助大家更好地理解和应用Python中的定时任务功能。
import subprocess
import datetime
from apscheduler.schedulers.blocking import BlockingScheduler
day_log_file = '/root/logdir/info.kongdao.log'
req_count_log_path = '/root/logdir/request/req_count/'
# 定时任务,每天晚上分析当天的日志数据
def log_job()
在日常工作中,我们常常会用到需要周期性执行的任务,一种方式是采用 Linux 系统自带的 crond 结合命令行实现。另外一种方式是直接使用Python。接下来整理的是常见的Python定时任务的实现方式。
一、利用while True: + sleep()实现定时任务
位于 time 模块中的 sleep(secs) 函数,可以实现令当前执行的线程暂停 secs 秒后再继续执行。所谓暂停,即令当前线程进入阻塞状态,当达到 sleep() 函数规定的时间后,再由阻塞状态转为就绪状态,等待 CPU 调度。