关于程序员:shell-awk命令

4次阅读

共计 1687 个字符,预计需要花费 5 分钟才能阅读完成。

awk 命令

awk 是 shell 进阶的重要命令,能够用来编排字段

awk 把输出流看做一串记录的汇合,每条记录都能够进一步细分为字段,一个 awk 程序是一对以模式和大括号框起来的操作组合而成的,awk 每次从文件中读取一条记录

 awk [选项] '条件 {动作} 条件 {动作}' 文件
 
 -v 设置变量值 
pattern {action} 如模式匹配,则执行操作
pattern {action}

<!– more –>

# 打印第一个字段
awk 'print $1'
# 打印整行
awk 'print $0'
# 打印第 2 与第 5 个字段
awk 'print $2,$5'
# 打印非空行
awk 'NF  > 0 {print $0}'

在读取数据时,默认的分隔符是空格,能够应用 - F 来指定分隔符

#awk [-F 分隔符] '命令' input-file
# 分隔符默认是空格
# 例:打印出 root 用户记录
awk -F: '$1=="root"{print $0}' /etc/passwd

在输入数据时,默认的分隔符是空格,能够应用 - v 来设置输入字段分隔符

# 默认状况下,-v 扭转输入字段的分隔字符, 这里必须设置 OFS 变量来扭转输入字段分隔符
awk -F: -v 'OFS=**' '{print $1,$5}' /etc/passwd

标量变量

保留繁多值的变量叫做标量变量,罕用的有

  • FILENAME 以后输出文件的名称
  • FNR 以后输出文件的以后行号,当有多个输出文档时相当有用

    FNR == 3   选定第三条记录 
  • FS 字段分隔符,默认为空格
  • NF 以后记录的字段数

    NF == 0    选定空记录
    NF > 3     选定领有三个字段以上的记录
    NF < 5     选定第 1 到第 4 条记录 
  • NR 输出数据流的以后行号
  • OFS 输入字段分隔字符,默认为空格
  • ORS 输入记录分隔字符,默认为 \n
  • RS 输出记录分隔字符
  • $0 以后行的全部内容
  • $n 以后行的第 n 的字段的内容

自定义变量

能够应用 - v 来设置自定义变量

free | awk -v age="10" -v name="lily" '{print name,age}'

lily 10
lily 10
lily 10

BEGIN 和 END

BEIGIN

BEGIN 导致动作指令仅在读取任何数据记录之前执行一次

awk 'BEGIN {print"OK"}'
OK

END

END 导致动作指令仅在读取完所有数据记录后执行一次

free | awk 'END {print" 共有 "NR" 行 "}'
共有 3 行 

条件判断

awk 还反对 if 判断语句

if(判断条件){动作指令 1;} else if(判断条件 2){动作指令 2;} else {动作指令 N;}
free | awk '{if(NR==1){print $1}else if(NR==2){print $2}}'
total
8008932

循环语句

awk 还反对循环,如 for 循环、while 循环,且反对应用 continue、break、exit 来进行中断

for 循环

for(表达式 1; 表达式 2; 表达式 3) {动作指令序列}
awk 'BEGIN{for (i=1;i<=4;i++) {print i}}'
1
2
3
4

while 循环

while(条件判断){动作指令序列;}
awk 'BEGIN{i=1; while(i<=4) {print i;i++}}'
1
2
3
4

命令行参数

awk 通过内建变量 ARGC(参数计数) 和 ARGV(参数值) 让命令行参数可用

awk 'BEGIN {print ARGV[0]}'
输入 awk
awk 'BEGIN {for (k=0;k<ARGC;k++) print"ARGV["k"]=["ARGV[k]"]"}' a b c
ARGV[0]=[awk]
ARGV[1]=[a]
ARGV[2]=[b]
ARGV[3]=

举例

统计磁盘可用空间

df | grep -v tmpfs | awk '{sum+=$4} END{print" 磁盘可用容量:"sum/1024/1024"G"}''
磁盘可用容量:1.01912G

统计 nginx 各 ip 拜访次数

awk ' \
> {IP[$3]++} \
> END { \
> for (i in IP) {print i,IP[i]} \
> }' /var/log/nginx/access.log

https://zhhll.icu/2022/linux/shell/awk 命令 /

本文由 mdnice 多平台公布

正文完
 0