1. Shell 脚本规范

一个规范的 Shell 脚本在第一行会指出由哪个程序(解释器)来执行脚本中的内容,这一行内容在 Linux bash 的编程一般为:

#! /bin/bash
# 或者, 不过注意,要在255个字符以内!
#! /bin/sh    

在执行bash脚本的时候,内核会根据“#!”后的解释器来确定该用哪个程序解释这个脚本中的内容,不过注意。这一行必须位于每个脚本顶端的第一行,如果不是第一行则为脚本的注释行。

类似这种的有很多,例如:

  • #! /bin/sh
  • #! /bin/bash
  • #! /usr/bin/awk
  • #! /bin/sed
  • #! /usr/bin/tcl
  • #! /usr/bin/expect
  • #! /usr/bin/perl
  • #! /usr/bin/env python
  • 如果在脚本开头的第一行不指定解释器,那么就要用对应的解释器来执行脚本,这样才能确保脚本正确执行,例如:

    如果是 Shell 脚本,就用bash test.sh 执行

    如果是Python 脚本,就用 python test.py 执行

    如果是expect 脚本,就用 expect test.py 执行

    2. Shell 脚本执行

    当 Shell 脚本运行时,它会先查找系统环境变量 ENV,该变量指定了环境文件(加载顺序通常是 /etc/profile~/.bash_profile~/.bashrc/etc/bashrc等),在加载了上述环境变量文件后,Shell 就开始执行 Shell 脚本中的内容。

    Shell 脚本是从上到下,从左至右依次执行每一行的命令及语句的,既执行完了一个命令后在执行下一个,如果在 Shell 脚本中遇到子脚本(即脚本嵌套)时,就会先执行子脚本的内容,完成后再返回父脚本继续执行父脚本内后续的命令及语句,

    通常情况下,在执行 Shell 脚本时,会向系统内核请求启动一个新的进程,以便在该进程中执行脚本的命令及子Shell脚本,基本流程如下图所示。

    设置 Linux 的 crond 任务时,最好能在定时任务脚本中重新定义系统环境变量,否则,一些系统环境变量将不会被加载,这个问题需要注意!

    3. Shell 脚本变量

    存放一个值的空间即为变量,

    默认情况下,在 bash shell 中是不会区分变量类型的,例如:常见的变量类型为数字、字符串、小数等,这和其他强类型语言(例如:Java/C语言)是有区别的,当然,如果需要指定Shell变量的类型,也可以使用 declare 显示定义变量的类型,但在一般情况下没有这个需求,Shell 开发者在开发脚本时需要自行注意 Shell 脚本中变量的类型。

    变量可分为两类:环境变量(全局变量)和普通变量(局部变量)

    环境变量也可称为全局变量,可以在创建它们的Shell 及其派生出来的任意子进程 Shell 中使用,环境变量又可分为自定义环境变量和 bash 内置的环境变量。

    普通变量也可称为局部变量,只能在创建它们的Shell函数或Shell脚本中使用,普通变量一般由开发者在开发脚本程序时创建。

    3.1 环境变量

    环境变量一般是指用 expirt 内置命令导出的变量,用于定义 Shell 的运行环境,保证 Shell 命令的正确执行,Shell 通过环境变量来确定登录用户名命令路径终端类型登录目录等,所有的环境变量都是系统全局变量,可用于所有子进程中,这包括编辑器、Shell 脚本和各类应用。

    环境变量可以在命令行中设置和创建,但用户退出命令时这些变量值就会丢失,因此,如果希望永久保存环境变量,可在用户家目录下的.bash_profile.bashrc(非用户登录模式特有,例如远程 SSH)文件中,或者全局配置/etc/bashrc(非用户登录模式特有,例如远程 SSH)或 /etc/profile 文件中定义,在将环境变量放入上述的文件中后,每次用户登录时这些变量都将被初始化。

    按照系统规范,所有环境变量的名字均采用大写形式,在将环境变量应用于用户进程程序之前,都应该用 expirt 命令导出定义,例如:正确的环境变量定义方法为 exprot OLDGIRL=1

    有一些环境变量,比如 HOME、PATH、SHELL、UID、USER 等,在用户登录之前就已经被 /bin/login 程序设置好了,通常环境变量被定义保存在用户家目录下的.bash_profile 文件或全局的配置文件/etc/profile中。

    在查看设置的变量时,有3个命令可以显示变量的值:set、env 和 declare(替代早期 typeset)set 命令输出所有的变量,包括全局变量和局部变量,env 命令只显示全局变量,declare 命令输出所有的变量、函数、整数和已经导出的变量,set -o 命令显示 bash Shell 的所有参数配置信息

    系统变量表见系统环境变量表

    3.1.1 自定义环境变量

    (1)设置环境变量

    如果想要设置环境变量,就要在给变量赋值之后或在设置变量时使用 export 命令,另外,除了 export 命令。带 -x 选项的 declare 内置命令也可以完成同样的功能(注意:此处不要再前面加 $)

    export 命令和 declare 命令的格式如下:

    export 变量名=value
    变量名=value ; export 变量名
    declare -x 变量名=value
    
    [root@www ~]$ export NAME=oldboy
    [root@www ~]$ NAME=oldboy ; export NAME
    [root@www ~]$ declare -x NAME=oldboy
    

    (2)设置环境变量(永久生效)

    用户的环境变量配置:

    [root@www ~]$ ls /root/.bashrc			# 推荐再此文件中优先设置
    /root/.bashrc
    [root@www ~]$ ls /root/.bash_profile
    /root/.bash_profile
    

    全局的环境变量配置

    [root@www ~]$ /etc/profile
    [root@www ~]$ /etc/bashrc
    [root@www ~]$ /etc/profile.d/
    

    若要在登陆后初始化或显示加载内容,则把脚本文件放在 /etc/profile.d/ 下即可(无需加载执行权限)

    (3)设置登录提示的两种方式

    第一种是在/etc/motd里增加提示的字符串,如下:

    [root@www ~]$ cat /etc/motd
    welcome to Linux.
    

    第二种是在/etc/profile.d/下面增加如下脚本:

    [root@www ~]$ cat /etc/profile.d/login_info.sh
    echo "welcome to Linux."
    

    以下是在生产场景下(在Java环境中),自定义环境变量的示例。

    export JAVA_HOME=/application/jdk
    export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
    export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH:$HOME/bin
    export RESIN=/applaction/resin
    

    上述的环境变量设置通常放在/etc/profile全局环境变量里,

    如果是写Java的脚本,那么最好是把上述 Java 环境配置放入脚本内重新定义,特别是作为定时任务执行的脚本。

    3.1.3 环境变量初始化与对应文件的生效顺序

    在登录Linux系统并启动一个 bash shell 时,默认情况下 bash 会在若干个文件中查找环境变量的设置,这些文件可统称为系统环境文件,bash 检查的环境变量文件的情况取决于系统运行 Shell 的方式,系统运行 Shell 的方式有 3 种。

    (1)通过系统用户登录后默认运行的 Shell

    (2)非登录交互式运行 Shell

    (3)执行脚本运行非交互是 Shell

    当用户登录 Linux 系统时,Shell 会作为登录 Shell 启动,此时的登录 Shell 加载环境变量的顺序如上图。

    用户登录系统后首先会加载 /etc/profile 全局环境变量文件,这是 Linux 系统上默认的 Shell 主环境变量文件,系统上每个用户登录都会加载这个文件。

    当加载完 /etc/profile 文件后,才会执行 /etc/profile.d/目录下的脚本文件,这个目录下的脚本文件由很多,例如:系统的字符集设置(/etc/sysconfig/i18n)等,以便用户登录后即可运行脚本

    之后开始运行 $HOME/.bash_profile(用户环境变量文件),在这个文件中,又会去找 $HOME/.bashrc(用户环境变量文件),如果有,则执行,如果没有,则不执行,在$HOME/.bashrc文件中又会去找/etc/bashrc(全局环境变量文件),如果有,则执行,如果没有,则不执行。

    如果用户的Shell 不是登录时启动的(比如手动敲下 bash 时启动或者其他不需要输入密码的登录及远程 SSH 连接情况)那么这种非登录 Shell 只会加载 $HOME/.bashrc(用户环境变量文件),并会去找 /etc/bashrc(全局环境变量文件),因此如果希望在非登录 Shell 下也可读到设置的环境变量等内容,就需要将变量设定写入 $HOME/.bashrc 或者 /etc/bashrc,而不是 $HOME/.bash_profile/etc/profile

    3.2 普通变量

    3.2.1 定义本地变量

    变量的赋值,一般有五种写法:

    name=value
    name1='value'
    name_2="value"
    _name_3=`cmd`
    _na_me_4=$(cmd)
    

    变量名一般是由字母、数字、下划线组成的,可以以字母或下划线开头,

    获取当前 Shell 脚本所有传参的参数,不加引号和 $* 相同,如果加上双引号,例如:"$@",则表示将所有的参数视为不同的独立字符串,相当于"$1" "$2" "$3" "...",这是将多参数传递给其他程序的最佳方式,因为他会保留所有的内嵌在每个参数里的任何空白,当"$@"和"$*"都加上 双引号时,两者时有区别的,都不加双引号时,两者无区别 获取执行上一个指令的执行状态返回值(0未成功,非零为失败),这个 获取当前执行的 Shell 脚本的进程号(PID),这个变量不常用,了解即可 获取上一个在后台工作的进程的进程号(PID),这个变量不常用,了解即可 获取再次之前执行的命令或脚本的最后一个参数,这个变量不常用,了解即可 HOME # 当前用户的主目录 IFS # shell用来将文本字符串分割成字段的一系列字符 MAIL # 当前用户手机哪像的文件名(bash shell会检查这个文件,看看有没有新邮件) MAILPATH # 冒号分割的当前用户收件箱的文件名列表(bash shell会检查这个文件,看有没有新邮件) OPTARG # getopts命令处理的最后一个选项参数值 OPTIND # getopts命令处理的最后一个选项参数的索引号 PATH # shell查找命令的目录列表,由冒号分隔 PS1 # shell命令行界面的主提示符 PS2 # shell命令行界面的次提示符 BASH # 当前shell实例的全路径名 BASH_ALIASES # 含有当前已设置别名的关联数组 BASH_ARGC # 含有传入子函数或shell脚本的参数总数的数组变量 BASH_ARCV # 含有传入子函数或shell脚本的参数的数组变量 BASH_CMDS # 关联数组,包含shell执行过的命令的所在位置 BASH_COMMAND # shell正在执行的命令或马上就执行的命令 BASH_ENV # 设置了的话,没个bash脚本会在运行前先尝试运行该变量定义的启动文件 BASH_EXECUTION_STRING # 使用bash -c选项传递过来的命令 BASH_LINENO # 含有当前执行的shell函数的源代码行号的数组变量 BASH_REMATCH # 只读数组,在使用正则表达式的比较运算符=~进行肯定匹配(positive match)时,包 含了匹配到的模式和子模式 BASH_SOURCE # 含有当前正在执行的shell函数所在源文件名的数组变量 BASH_SUBSHELL # 当前子shell环境的嵌套级别(初始值是0) BASH_VERSINFO # 含有当前运行的bash shell的主版本号和次版本号的数组变量 BASH_VERSION # 当前运行的bash shell的版本号 BASH_XTRACEFD # 若设置成了有效的文件描述符(0,1,2),则'set -x'调试选项生成的跟踪输出可被重定向。通常用来跟踪输出到一个文件中 BASHOPTS # 当前启用的bash shell选项的列表 BASHPID # 当前bash进程的PID COLUMNS # 当前bash shell实例所用终端的宽度 COMP_LINE # 当前命令行 COMP_POINT # 当前光标位置相对于当前命令起始的索引 COMP_KEY # 用来调试shell函数不全功能的最后一个键 COMP_TYPE # 一个整数值,表示所尝试的不全类型,用以完成shell函数补全 COMP_WORDBREAKS # Readline库中用于单词补全的词分隔字符 COMP_WORDS # 含有当前命令行所有单词的数组变量 COMPREPLY # 含有由shell函数生成的可能填充代码的数组变量 COPROC # 占用未命名的协进程的I/O文件描述符的数组变量 DIRSTACK # 含有目录栈当前内容的数组变量 EMACS # 设置为't'时,表明emasc shell缓冲区正在工作,而编辑功能被禁止 ENV # 如果设置了该环境变量,在bash shell脚本运行之前会先执行已定义的启动文件(仅用于当bash shell以POSIX模式被调用时) EUID # 当前用户的有效用户ID(数字形式) FCEDIT # 供fc命令使用的默认编辑器 FIGNORE # 在进行文件名不全时可以忽略后缀名列表,由冒号分分隔 FUNCNAME # 当执行的shell函数的名称 FUNCNEST # 当设置成非零值时,表示所允许的最大函数嵌套及数(一旦超出,当前命令即被终止) GLOBIGNORE # 冒号分隔的模式列表, 定义了在进行文件名扩展时可以忽略一组文件名。 GROUPS # 含有当前用户属组列表的数组变量 histchars # 控制历史记录扩展,最多可有3个字符 HISTCMD # 当前命令在历史记录中的编号 HISTCONFTROL # 控制哪些命令留在历史记录列表中 HISTFILE # 保存shell历史记录列表的文件名(默认是 .bash_history) HISTFILESIZE # 最多在历史文件中存多少行 HISTTIMEFORMAT # 如果设置了且非空,就用作格式化字符串,以显示bash历史中每条命令的时间戳 HISTIGNORE # 由冒号分隔的模式列表,用来决定历史文件中哪些命令会被忽略 HISTSIZE # 最多在历史文件中存多少条命令 HOSTFILE # shell在补全主机名时读取的文件名称 HOSTNAME # 当前主机的名称 HOSTTYPE # 当前运行bash shell的机器 IGNOREEOF # shell在退出前必须受到连续的EOF字符的数量(如果这个值不存在,默认是1) INPUTRC # Readline初始化文件名(默认是.inputrc) LANG # shell的语言环境类别 LC_ALL # 定义了一个语言环境类别,能够覆盖LANG变量 LC_CTYPE # 决定如何解释出现在文件名扩展和模式匹配中的字符 LC_COLLATE # 设置字字符串时用的排序规则 LC_MESSAGES # 在解释前面带有$的双引号字符时,该环境变量决定了所采用的语言环境设置 LC_NUMERIC # 决定着格式化数字时采用的语言环境设置 LINENO # 当前执行的脚本的行号 LINES # 定义了终端上可见的行数 MACHTYPE # 用'CPU-公司-系统'(CPU-company-system)格式定义的系统类型 MAPFILE # 一个数组变量,当mapfile命令未指定数组变量作为参数时,它存储了mapfile所读入的文本 MAILCHECK # shell查看新邮件的频率(以秒为单位,默认值是60) OLDPWD # shell之前的工作目录 OPTERR # 当设置为1时,bash shell会显示getopts命令产生的错误 OSTYPE # 定义了shell 所在的操作系统 PIPESTATUS # 含有前台进程的退出状态列表的数组变量 POSIXLY_CORRECT # 设置了的话,bash会以POSIX模式启动 PPID # bash shell父进程的PID PROMPT_COMMAND # 设置了的话,在命令行主提示符显示之前会执行这条命令 PROMPT_DIRTRIM # 用来定义当启用\w或\w提示符字符串转移时显示的尾部目录名的数量,被删除的目录名会用一组英文据点替换。 PS3 # select 命令的提示符 PS4 # 如果使用了bash的-x选项,在命令行之前显示的提示信息 PWD # 当前工作目录 RANDOM # 返回一个0 ~ 32767的随机数(对其的赋值可作为随机数生成器的种子) READLINE_LINE # 当使用bind -x命令时,存储Readline缓冲区的内容 READLINE_POINT # 当使用bind -x命令时,表示Readline缓冲区内容插入点的当前位置 REPLY # read命令的默认变量 SECONDS # 自从shell启动到现在的秒数(对其赋值将会重置计数器) SHELL # bash shell 的全路径名 SHELLOPTS # 已启用bash shell 选项列表,列表项之间以冒号分割 SHLVL # shell的层级,每次启动一个新bash shell,该值增加1 TIMEFORMAT # 指定了shell的时间显示格式 TMOUT # select和read命令在没输入的情况下等待多久(以秒为单位),默认值为0,表示无限长 TMPDIR # 目录名,保存bash shell创建的临时文件 UID # 当前用户的真实用户ID(数字形式)