Shell

1 概论

shell是我们通过命令行与操作系统沟通的语言

shell脚本可以直接在命令行中执行,也可以将一套逻辑组织成一个文件,方便复用

Linux中常见的shell脚本有很多种,常见的有:

  • Bourne Shell(/usr/bin/sh or /bin/sh)

  • Bourne Again Shell(/bin/bash)

  • C Shell(/usr/bin/csh)

  • K Shell(/usr/bin/ksh)

  • zsh

  • ...

    在一般情况下,并不区分Bourne Shell和Bourne Again Shell,所以像#!/bin/sh,可以改为#!/bin/bash

2 运行方式

  • 作为可执行文件

    acs@9e0ebfcd82d7:~$ chmod +x test.sh  # 使脚本具有可执行权限
    acs@9e0ebfcd82d7:~$ ./test.sh  # 当前路径下执行
    acs@9e0ebfcd82d7:~$ /home/acs/test.sh  # 绝对路径下执行
    acs@9e0ebfcd82d7:~$ ~/test.sh  # 家目录路径下执行

    运行时一定要写成./test.sh,因为直接写test.sh,Linux会去PATH里寻找,而一般只有/bin,/sbin,/usr/bin,/usr/sbin等在PATH中,所以使用./test.sh告诉系统,就在本目录下找

  • 解释器执行

    acs@9e0ebfcd82d7:~$ bash test.sh

3 注释

  • 单行注释 每行中#之后的内容均是注释

  • 多行注释

4 内建命令和外部命令

  • 内建命令不需要创建子进程

  • 内建命令对当前Shell生效

5 变量

变量命名规则

  1. 变量名称可以由字母、数字和下划线组成,但是不能以数字开头

  2. 等号两侧不能有空格

  3. 变量名称一般习惯为大写

  4. 在bash中,变量默认类型都是字符串类型,无法直接进行数值运算

  5. 变量的值如果有空格,需要使用双引号或单引号括起来

变量类型

  • 自定义变量(局部变量,子进程不能访问的变量 )

  • 环境变量(全局变量,子进程可以访问的变量)

    • $HOME、$PATH、$PWD、$USER、$SHELL、\$PS1

  • 自定义变量改成环境变量

  • 环境变量改为自定义变量

字符串

字符串可以用单引号,也可以用双引号,也可以不用引号

  • 单引号与双引号的区别

    • 单引号中的内容会原样输出,不会执行、不会取变量

    • 双引号中的内容可以执行、可以取变量

  • 获取字符串长度

  • 提取子串

预定义变量

  • 文件参数变量(在执行shell脚本时,可以向脚本传递参数。$1是第一个参数,$2是第二个参数,10以上大括号包含${10},以此类推。特殊的,$0是文件名包含路径

    创建文件test.sh:

    然后执行该脚本:

  • 其它参数相关变量

    参数
    说明

    $#

    代表文件传入的参数个数,如上例中值为4

    $*

    由所有参数构成的用空格隔开的字符串,如上例中值为"$1 $2 $3 $4"

    $@

    每个参数分别用双引号括起来的字符串,如上例中值为"$1" "$2" "$3" "$4"

    $$

    当前进程PID

    $?

    上一条命令的退出状态(注意不是stdout,而是exit code)。0表示正常退出,其他值表示错误

    $(command)

    返回command这条命令的stdout(可嵌套)

    `command`

    返回command这条命令的stdout(不可嵌套)

  • 环境变量配置文件(数字代表加载顺序,第二列数字是nologin加载顺序)

    • /etc/profile 1

    • /etc/profile.d/

    • ~/.bash_profile 2

    • ~/.bashrc 3 1

    • /etc/bashrc 4 2

etc下面代表所有用户通用配置

~开头代表用户特有配置,一个login shell,一个nologin shell

su - root 带减号login shell

6 shell特殊字符

  • {}

  • 通配符

    • *代表多个字母或数字

    • ?代表一个字母或数字 ls a* ls a? ls f080[1-6].tif

  • 转义字符\ ls /mnt/win1/My\Documents

  • 单引号:不处理任何变量和命令 echo 'Welcome $NAME, the date is date'

  • 双引号:处理变量但不处理命令 echo "Welcome $NAME, the date is date"

  • 反引号:把引号中的每个单词作为一个命令,如果是变量则先求值然后作为一个命令处理

7 运算符

  • $((运算式)) or $[运算式]

  • expr m + n (+、-、*、/、**、%) # expr运算符间要有空格

8 数组

数组中可以存放多个不同类型的值,只支持一维数组,初始化时不需要指明数组大小。 数组下标从0开始

9 expr命令

  • expr 表达式

    • 用空格隔开每一项

    • 用反斜杠放在shell特定的字符前面(发现表达式运行错误时,可以试试转义)

    • 对包含空格和其他特殊字符的字符串要用引号括起来

    • expr会在stdout中输出结果。如果为逻辑关系表达式,则结果为真,stdout为1,否则为0

    • expr的exit code:如果为逻辑关系表达式,则结果为真,exit code为0,否则为1

  • 字符串表达式

    • length STRING

    • index STRING CHARSET CHARSET中任意单个字符在STRING中最前面的字符位置,下标从1开始。如果在STRING中完全不存在CHARSET中的字符,则返回0

    • substr STRING POSITION LENGTH 返回STRING字符串中从POSITION开始,长度最大为LENGTH的子串。如果POSITION或LENGTH为负数,0或非数值,则返回空字符串

  • 整数表达式

    • expr支持普通的算术操作,算术表达式优先级低于字符串表达式,高于逻辑关系表达式

    • + - 加减运算。两端参数会转换为整数,如果转换失败则报错

    • * / % 乘,除,取模运算。两端参数会转换为整数,如果转换失败则报错

    • () 表示优先级,但需要用反斜杠转义

  • 逻辑关系表达式

    • | 如果第一个参数非空且非0,则返回第一个参数的值,否则返回第二个参数的值,但要求第二个参数的值也是非空或非0,否则返回0。如果第一个参数是非空或非0时,不会计算第二个参数

    • & 如果两个参数都非空且非0,则返回第一个参数,否则返回0。如果第一个参为0或为空,则不会计算第二个参数

    • < <= = == != >= > 比较两端的参数,如果为true,则返回1,否则返回0。”==”是”=”的同义词。”expr”首先尝试将两端参数转换为整数,并做算术比较,如果转换失败,则按字符集排序规则做字符比较

    • () 表示优先级,但需要用反斜杠转义

10 read命令

read命令用于从标准输入中读取单行数据。当读到文件结束符时,exit code为1,否则为0

参数说明

11 echo命令

  • 显示普通字符串

  • 显示转义字符

  • 显示变量

  • 显示换行

  • 显示不换行

  • 显示结果定向至文件

  • 原样输出字符串,不进行转义或取变量(用单引号)

  • 显示命令的执行结果

12 printf命令

printf format-string [arguments...] 默认不会在字符串末尾添加换行符

13 test命令与判断符号[]

  • 逻辑运算符&&和||

    • && 表示与,|| 表示或

    • 二者具有短路原则

      expr1 && expr2:当expr1为假时,直接忽略expr2 expr1 || expr2:当expr1为真时,直接忽略expr2

    • 表达式的exit code为0,表示真;为非零,表示假

  • test命令

    • 在命令行中输入man test,可以查看test命令的用法

    • test命令用于判断文件类型,以及对变量做比较

    • test命令用exit code返回结果,而不是使用stdout。0表示真,非0表示假

    • 文件类型判断 test -e filename # 判断文件是否存在

      参数
      代表意义

      -e

      文件是否存在

      -f

      是否为文件

      -d

      是否为目录

    • 文件权限判断 test -r filename # 判断文件是否可读

      参数
      代表意义

      -r

      文件是否可读

      -w

      文件是否可写

      -x

      文件是否可执行

      -s

      是否为非空文件

    • 整数间的比较 test $a -eq $b # a是否等于b

      参数
      代表意义

      -eq

      a是否等于b

      -ne

      a是否不等于b

      -gt

      a是否大于b

      -lt

      a是否小于b

      -ge

      a是否大于等于b

      -le

      a是否小于等于b

    • 字符串比较

      参数
      代表意义

      test -z STRING

      判断STRING是否为空,如果为空,则返回true

      test -n STRING

      判断STRING是否非空,如果非空,则返回true(-n可以省略)

      test str1 == str2

      判断str1是否等于str2

      test str1 != str2

      判断str1是否不等于str2

    • 多重条件判定 test -r filename -a -x filename

      参数
      代表意义

      -a

      两条件是否同时成立

      -o

      两条件是否至少一个成立

      !

      取反。如 test ! -x file,当file不可执行时,返回true

  • 判断符号[]

    []与test用法几乎一模一样,更常用于if语句中。另外[[]]是[]的加强版,支持的特性更多

    []内的每一项都要用空格隔开

    中括号内的变量,最好用双引号括起来

    中括号内的常数,最好用单或双引号括起来

14 判断语句

if后要有空格

[ 条件判断式 ]中括号和条件判断式之间必须有空格

条件非空即为true,[ atguigu ]返回true,[] 返回false

  • 单层if

  • 单层if-else

  • 多层if-elif-elif-else

  • case…esac形式

15 循环语句

  • for…in…do…done

  • for ((…;…;…)) do…done

  • while…do…done循环

  • until…do…done循环(当条件为真时结束)

  • break命令(跳出当前一层循环,注意与C/C++不同的是:break不能跳出case语句)

  • continue命令

  • 死循环的处理方式

    • 使用top命令找到进程的PID,输入kill -9 PID即可关掉此进程

    • Ctrl+c

16 函数

  • bash中的函数类似于C/C++中的函数,但return的返回值与C/C++不同,返回的是exit code,取值为0-255,0表示正常结束

  • 如果想获取函数的输出结果,可以通过echo输出到stdout中,然后通过$(function_name)来获取stdout中的结果

  • 必须在调用函数地方之前,先声明函数,shell脚本是逐行运行,不会像其它语言一样先编译

  • 函数返回值,只能通过$?系统变量获得,可以显示加:return返回,如果不加,将以最后一条命令运行结果,作为返回值。return后跟数值n(0-255)

  • 局部变量local修饰,不进行修饰那么函数执行后,其他地方也可以使用

  • 函数的参数$1 $2 ... $n

  • 不获取 return值和stdout值

  • 获取 return值和stdout值

  • 函数的输入参数

    在函数内,$1表示第一个输入参数,$2表示第二个输入参数,依此类推。

    注意:函数内的$0仍然是文件名,而不是函数名

  • 函数内的局部变量

    可以在函数内定义局部变量,作用范围仅在当前函数内。

    可以在递归函数中定义局部变量

17 exit命令

exit命令用来退出当前shell进程,并返回一个退出状态;使用$?可以接收这个退出状态

exit命令可以接受一个整数值作为参数,代表退出状态。如果不指定,默认状态值是 。

exit退出状态只能是一个介于 0~255 之间的整数,其中只有 0 表示成功,其它值都表示失败

18 文件重定向和管道

每个进程默认打开3个文件描述符

  • stdin标准输入,从命令行读取数据,文件描述符为0

  • stdout标准输出,向命令行输出数据,文件描述符为1

  • stderr标准错误输出,向命令行输出数据,文件描述符为2

命令
说明

command > file

将stdout重定向到file中

command < file

将stdin重定向到file中

command >> file

将stdout以追加方式重定向到file中

command n> file

将文件描述符n重定向到file中

command n>> file

将文件描述符n以追加方式重定向到file中

  • 输入和输出重定向

  • 同时重定向stdin和stdout

  • 管道

    • 将前一个命令的结果传递给后面的命令

    • car xxx | more

    • cat | ps -f

19 引入外部文件

20 高级文本操作

正则元字符(. * [] ^ & \ + ?|)

find find 路径 查找条件 [补充条件]

cut

cut的工作就是“剪”,具体的说就是在文件中负责剪切数据用的。cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段输出

  • cut [选项参数] filename(-f 列号 -d 分隔符 -b字节分割)

  • 说明:默认分隔符是制表符

sed

sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾

  • 替换命令s

    • sed 's/old/new' filename...

    • sed -e 's/old/new' 's/old/new' filename...

    • sed -i 's/old/new' 's/old/new' filename...

    • sed 's/正则/new' filename...

    • sed -r 's/扩展正则/new' filename... (+ ? |)

  • 多行模式N、D、P

  • 保持空间

    • h和H将模式空间内容存放到保持空间

    • g和G将保持空间内容取出到模式空间

    • x交换模式空间和保持空间内容

awk

一个强大的文本分析工具,把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行分析处理

  • awk [选项参数]‘pattern1{action1}pattern2{action2}...’filename(pattern:表示AWK在数据中查找的内容,就是匹配模式 action:在找到匹配内容时所执行的一系列命令)

  • 选项参数说明(-F 指定输入文件折分隔符 -v 赋值一个用户定义变量)

  • 表达式

    • 复制操作符

    • 算数操作符

    • 系统变量FS、NFS、RS、NR、NFR、NF

    • 关系操作符

    • 布尔操作符

  • 条件语句

  • 循环语句

  • 数组

  • 函数

  • awk的内置变量(FILENAME 文件名 NR 已读的记录数 NF 浏览记录的域的个数)

sed vs awk

  • awk更像脚本语言

  • awk用于“比较规范”的文本处理,用于统计数量并输出制定字段

  • sed将不规范的文本处理成“比较规范”的文本

sort

sort命令是在Linux里非常有用,它将文件进行排序,并将排序结果标准输出

  • sort(选项)(参数)(-n 依照数值的大小排序 -r 以相反的顺序来排序 -t 定排序时所用的栏位分隔字符 -k 指定需要排序的栏位 参数:指定待排序的文件列表)

企业真题

  • 使用Linux命令查询file1中空行所在的行号awk '/^$/{print NR}' sed.txt

  • 有文件内容如下 张三 40 李四 50 王五 60(三行),使用Linux命令计算第二列的和并输出cat chengji.txt | awk -F " " '{sum+=$2} END{print sum}'

  • 请用shell脚本写出查找当前文件夹(/home)下所有的文本文件内容中包含有字符”shen”的文件名称grep -r "shen" /home | cut -d ":" -f 1

  • Shell脚本里如何检查一个文件是否存在?如果不存在该如何处理?

  • 用shell写一个脚本,对文本中无序的一列数字排序

practise

Last updated