Maison  >  Article  >  Tutoriel système  >  Ce que vous ne savez pas sur crontab sous Linux

Ce que vous ne savez pas sur crontab sous Linux

WBOY
WBOYavant
2024-02-14 13:10:03926parcourir

Dans le travail réel, divers problèmes peuvent survenir avec crontab. Ci-dessous, nous examinerons les problèmes susceptibles de survenir dans crontab lors de travaux spécifiques et les méthodes permettant de résoudre ces problèmes.

1. Fonctions de crontab

crond est un processus démon utilisé pour effectuer des tâches périodiquement ou attendre que certains événements soient traités sous Linux. C'est similaire aux tâches planifiées sous Windows. Lorsque le système d'exploitation est installé, cet outil de service sera installé par défaut et le processus crond sera automatiquement démarré. Le processus crond vérifie régulièrement toutes les minutes s'il y a une tâche à exécuter, et si c'est le cas, la tâche est automatiquement exécutée.

La planification des tâches sous Linux est divisée en deux catégories : la planification des tâches système et la planification des tâches utilisateur.

  • Planification des tâches système : tâches que le système effectue périodiquement, telles que l'écriture des données mises en cache sur le disque dur, le nettoyage des journaux, etc.
  • Planification des tâches utilisateur : tâches que les utilisateurs effectuent régulièrement, telles que la sauvegarde des données utilisateur, les rappels réguliers par e-mail, etc. Les utilisateurs peuvent utiliser l'outil crontab pour personnaliser leurs propres tâches planifiées. Tous les fichiers crontab définis par l'utilisateur sont enregistrés dans le répertoire /var/spool/cron avec le même nom de fichier que le nom d'utilisateur.

crontab est très largement utilisé dans les applications d'entreprise réelles. Les utilisations courantes incluent la sauvegarde planifiée des données, la détection planifiée du système, la collecte de données planifiée, la mise à jour planifiée de la configuration, la génération de rapports planifiée, etc.

2. Exemple d'application Crontab

1.Format d'utilisation de Crontab

Les formats de crontab couramment utilisés sont les suivants :

crontab [-u user] [file]
crontab [-u user] [-e|-l|-r |-i]

Les options ont les significations suivantes :

  • -u utilisateur : utilisé pour définir le service crontab d'un certain utilisateur. Par exemple, "-u ixdba" signifie définir le service crontab de l'utilisateur ixdba. Ce paramètre est généralement exécuté par l'utilisateur root.
  • file : file est le nom du fichier de commandes, ce qui signifie que file est utilisé comme fichier de liste de tâches de crontab et chargé dans crontab. Si ce fichier n'est pas spécifié sur la ligne de commande, la commande crontab acceptera les commandes saisies sur l'entrée standard (clavier) et les chargera dans crontab.
  • -e : modifie le contenu du fichier crontab d'un utilisateur. Si aucun utilisateur n'est spécifié, cela signifie éditer le fichier crontab de l'utilisateur actuel.
  • -l : Afficher le contenu du fichier crontab d'un certain utilisateur. Si aucun utilisateur n'est spécifié, cela signifie afficher le contenu du fichier crontab de l'utilisateur actuel.
  • -r : Supprime le fichier crontab d'un utilisateur du répertoire /var/spool/cron Si aucun utilisateur n'est spécifié, le fichier crontab de l'utilisateur actuel sera supprimé par défaut.
  • -i : donne une invite de confirmation lors de la suppression du fichier crontab de l'utilisateur.

2. Syntaxe du fichier crontab

Dans le fichier crontab créé par l'utilisateur, chaque ligne représente une tâche et chaque champ de chaque ligne représente un paramètre. Son format est divisé en six champs. Les cinq premières sections sont des sections de réglage du temps et la sixième section est la. segment de commande à exécuter, le format est le suivant :

minute hour day month week command

Parmi eux :

«

?minute : représente la minute, qui peut être n'importe quel nombre entier compris entre 0 et 59.

? Heure : Indique l'heure, qui peut être n'importe quel nombre entier compris entre 0 et 23.

?jour : représente la date, qui peut être n'importe quel nombre entier de 1 à 31.

? mois : représente le mois, qui peut être n'importe quel nombre entier de 1 à 12.

? semaine : indique le jour de la semaine, qui peut être n'importe quel nombre entier compris entre 0 et 7, où 0 ou 7 représente le dimanche.

?commande : La commande à exécuter peut être une commande système ou un fichier script écrit par vous-même.

Dans chacun des champs ci-dessus, vous pouvez également utiliser les caractères spéciaux suivants :

? 星号():代表所有可能的值,例如month字段如果是星号,则表示在满足其它字段的制约条件后每月都执行该命令操作。

? 逗号(,):可以用逗号隔开的值指定一个列表范围,例如,“1,2,5,7,8,9”

? 中杠(-):可以用整数之间的中杠表示一个整数范围,例如“2-6”表示“2,3,4,5,6”

? 正斜线(/):可以用正斜线指定时间的间隔频率,例如“0-23/2”表示每两小时执行一次。同时正斜线可以和星号一起使用,例如/10,如果用在minute字段,表示每十分钟执行一次。

3、几个crontab例子

0 /3 /usr/local/apache2/apachectl restart

表示每隔3个小时重启apache服务一次。

30 3 6 /webdata/bin/backup.sh

表示每周六的3点30分执行/webdata/bin/backup.sh脚本的操作。

0 0 1,20 fsck /dev/sdb8

表示每个月的1号和20号检查/dev/sdb8磁盘设备。

10 5 /5 * echo "">/usr/local/apache2/log/access_log

表示每个月的5号、10号、15号、20号、25号、30号的5点10分执行清理apache日志操作。

三、系统级任务调度/etc/crontab

在/etc目录下有一个crontab文件,这个就是系统任务调度的配置文件。

/etc/crontab文件包括下面几行:

SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
HOME=/
# run-parts
01 * * * * root run-parts /etc/cron.hourly
02 4 * * * root run-parts /etc/cron.daily
22 4 * * 0 root run-parts /etc/cron.weekly
42 4 1 * * root run-parts /etc/cron.monthly

从上面的示例文件可看出,crontab的任务列表主要由两部分组成:环境变量配置与定时任务配置。可能大家在工作中更多是只用到了任务配置部分。

前四行是用来配置crond任务运行的环境变量,第一行SHELL变量指定了系统要使用哪个shell,这里是bash,第二行PATH变量指定了系统执行命令的路径,第三行MAILTO变量指定了crond的任务执行信息将通过电子邮件发送给root用户,如果MAILTO变量的值为空,则表示不发送任务执行信息给用户,第四行的HOME变量指定了在执行命令或者脚本时使用的主目录。第六至九行就是crontab执行格式的具体写法。

四、crontab调试解析神器

通常在使用crontab添加任务时,我们会依靠自己已有知识编写定时语句。当需要测试语句是否正确时,还需要在服务器上不断调试,,这种方式太不高效了。有没有一款工具,只要我们给出语句,就能告诉具体执行时间以及对错呢?还真有,下面介绍一款老外开发的crontab在线解析工具。

工具地址:https://crontab.guru

给出这个工具的截图如下:

关于 Linux 下的 crontab,你不知道的那些知识点

好用不好用,你试试就知道。

五、crontab使用的各种坑

1、环境变量问题

当我们刚使用crontab时,运维老鸟们一般会告知所有命令尽量都使用绝对路径,以防错误。这是为什么?这就和我们下面要谈的环境变量有关了。

首先,获取shell终端环境变量,内容如下:

[root@SparkWorker1 dylogs]# env
XDG_SESSION_ID=1629
HOSTNAME=SparkWorker1
TERM=linux
SHELL=/bin/bash
HISTSIZE=1000
SSH_CLIENT=172.16.213.132 50080 22
HADOOP_PREFIX=/opt/hadoop/current
CATALINA_BASE=/opt/hadoop/current/share/hadoop/httpfs/tomcat
SSH_TTY=/dev/pts/1
QT_GRAPHICSSYSTEM_CHECKED=1
USER=root
MAIL=/var/spool/mail/root
PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/usr/java/default/bin:/opt/hadoop/current/bin:/opt/hadoop/current/sbin:/root/bin
PWD=/data/dylogs
LANG=zh_CN.UTF-8
HOME=/root

要获取crontab环境变量信息,可以设置如下计划任务:

* * * * * /usr/bin/env > /tmp/env.txt

等待片刻,env.txt输出内容如下:

[root@SparkWorker1 dylogs]# cat /tmp/env.txt
XDG_SESSION_ID=1729
SHELL=/bin/sh
USER=root
PATH=/usr/bin:/bin
PWD=/root
LANG=zh_CN.UTF-8
SHLVL=1
HOME=/root
LOGNAME=root
XDG_RUNTIME_DIR=/run/user/0
_=/usr/bin/env

从上面输出结果可知,shell命令行的PATH值为

PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/usr/java/default/bin:/opt/hadoop/current/bin:/opt/hadoop/current/sbin:/root/bin

而crontab中的PATH值为:

PATH=/usr/bin:/bin

对比crontab环境变量与shell终端环境变量的输出,可以发现两者的差异很大。大家可能遇到过,在shell命令行执行脚本都没有问题,而放到crontab后却执行异常,或者执行失败,此时,我们就需要考虑是否命令涉及的环境变量在crontab和shell命令行间存在差异。

例如,我们在crontab中执行了如下定时任务:

20 16 * * * php autosave.php

而如果我们的php是安装在/usr/local/bin/目录下的话,那么上面这个定时任务由于无法找到php命令,会运行失败。

那么,知道了环境变量问题,可能导致计划任务无法正常执行,怎么才能避免这个问题呢,这个交给大家一个终极大招,可以在crontab中加入如下配置,保证你的计划任务执行不会出现环境变量问题:

* * * * * source /$HOME/.bash_profile && command

这个其实是在执行计划任务命令之前,先加载了用户环境变量信息,由此可保证所有环境变量都可正常加载。

2、定时时间配置误区

时间是crontab的核心,稍微配置不当,就会出现问题,先看在整点时间设置时可能出现的错误,例如,设定每天2点执行一次任务,很多朋友可能这么写过:

* 2 * * * command

很明显,这个时间写法是错误的,当我们听到每天2点执行一次某任务时,很多人会把重点放在2点,而忽略了执行一次的需求。上面这个定时任务他会在2点开始执行,每分钟执行一次,总共执行60次。

正确的写法应该是这样的:

0 2 * * * command

这个才表示每天2点0分执行command对应的任务。

3、特殊符号%问题

%在crontab中是特殊符号,具体含义如下:

第一个%表示标准输入的开始,其余%表示换行符,看下面两个例子:

* * * * * cat >> /tmp/cat.txt 2>&1 % stdin out

查看/tmp/cat.txt的内容为:

stdin out

再看下面这个例子:

* * * * * cat >> /tmp/cat1.txt 2>&1 % stdin out 1 % stdin out 2 % stdin out 3

查看 /tmp/cat1.txt的内容如下:

stdin out 1
stdin out 2
stdin out 3

有输出内容可知,第一个%表示标准输入的开始,其余%表示换行符。

既然”%”是特殊字符,那么在crontab中使用时,就要特别注意,怎么使用这些特殊字符呢,很明显,使用转移字符即可,例如:

* * * * * cat >> /tmp/cat2.txt 2>&1 % Special character escape \%.

查看输出/tmp/cat2.txt 输出内容如下:

Special character escape %.

可以看到,执行成功了,并成功避开这个坑了。

4、关于crontab的输出重定向

在crontab执行的计划任务中,有些任务如果不做输出重定向,那么原本会输出到屏幕的信息,会以邮件的形式输出到某个文件中,例如,执行下面这个计划任务:

* * * * * /bin/date

这个计划任务是没有做输出重定向的,他的主要用途是输出时间,由于没有配置输出重定向,那么这个时间信息默认将以邮件的形式输出到/var/spool/mail/$USER(这个$USER对应的是系统用户,这里是root用户)文件中,大致内容如下:

From root@SparkWorker1.localdomain Fri Sep 21 12:58:02 2022
Return-Path: 
X-Original-To: root
Delivered-To: root@SparkWorker1.localdomain
Received: by SparkWorker1.localdomain (Postfix, from userid 0)
id F2745192AE; Fri, 21 Sep 2022 12:58:01 +0800 (CST)
From: "(Cron Daemon)" 
To: root@SparkWorker1.localdomain
Subject: Cron  /bin/date
Content-Type: text/plain; charset=UTF-8
Auto-Submitted: auto-generated
Precedence: bulk
X-Cron-Env: 
X-Cron-Env: 
X-Cron-Env: 
X-Cron-Env: 
X-Cron-Env: 
X-Cron-Env: 
X-Cron-Env: 
X-Cron-Env: 
Message-Id: 
Date: Fri, 21 Sep 2022 12:58:01 +0800 (CST)
2022年 09月 21日 星期五 12:58:01 CST

由此可见,输出内容还是很多的,如遇到任务有大量输出的话,会占用大量磁盘空间,显然,这个邮件输出最好关闭,怎么关闭呢,只需设置MAILTO环境变量为空即可,上面的计划任务,可做如下修改:

MAILTO=""
* * * * * /bin/date

这样,就不会发邮件信息到/var/spool/mail/$USER下了,但是问题并没有彻底解决,关闭mail功能后,输出内容将继续写入到/var/spool/clientmqueue中,长期下去,可能占满分区的inode资源,导致任务无法执行。

为了避免此类问题发生,建议任务都加上输出重定向,例如,可以在crontab文件中设置如下形式,忽略日志输出:

0 */3 * * * /usr/local/apache2/apachectl restart >/dev/null 2>&1

其中,“/dev/null 2>&1”表示先将标准输出重定向到/dev/null,然后将标准错误重定向到标准输出,由于标准输出已经重定向到了/dev/null,因此标准错误也会重定向到/dev/null,这样日志输出问题就解决了。

5、调试crontab问题的一般思路

要解决crontab相关异常问题,可按照如下思路进行调试:

(1)、通过/var/log/cron日志确认任务是否执行

(2)、如未执行则分析定时语句,是否是环境变量问题、特殊字符问题、时间配置问题、权限问题等。

(3)、确认crond服务开启,如果定时语句也正确,检查crond服务是否开启。

Systemd方式(centos7及以上)

[root@SparkWorker1 spool]# systemctl status crond.service

SysVinit方式(centos7以下)

[root@SparkWorker1 spool]# service crond status

(4)确认定时任务中命令是否执行成功

这个问题可通过输出获取错误信息进行调试,方法就是利用重定向获取输出,然后进行分析。举例如下:

* * * * * python /usr/local/dyserver/dypos.py >> /tmp/dypos.log 2>&1

通过加上“/tmp/dypos.log 2>&1”,就可以很快定位问题,因为这个dypos.py脚本在执行的时候会把错误信息都输出到dypos.log 中,接着查看dypos.log文件,问题一目了然:

[root@SparkWorker1 spool]# cat /tmp/dypos.log
/bin/sh: python: 未找到命令
/bin/sh: python: 未找到命令

显示python命令没有找到,很明显的就可以确定是环境变量的问题。这种方式定位问题非常有效。

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer