Linux awk 命令详解(二) if 分支 数组

Linux awk 命令详解(二) if 分支 数组,第1张

一、awk if分支结构

二、awk数组 for循环

一、awk if分支结构

案例1

awk过滤中的if分支结构

1)单分支

统计/etc/passwd文件中UID小于或等于1000的用户个数:

统计/etc/passwd文件中UID大于1000的用户个数:

统计/etc/passwd文件中登录Shell是“/bin/bash”的用户个数:

2)双分支

分别统计/etc/passwd文件中UID小于或等于1000、UID大于1000的用户个数:

分别统计/etc/passwd文件中登录Shell是“/bin/bash”、 登录Shell不是“/bin/bash”的用户个数:

二、awk数组

注意,awk数组的下标除了可以使用数字,也可以使用字符串,字符串需要使用双引号:

案例3:awk扩展应用

1)awk统计Web访问排名

在分析Web日志文件时,每条访问记录的第一列就是客户机的IP地址,其中会有很多重复的IP地址。因此只用awk提取出这一列是不够的,还需要统计重复记录的数量并且进行排序。

通过awk提取信息时,利用IP地址作为数组下标,每遇到一个重复值就将此数组元素递增1,最终就获得了这个IP地址出现的次数。

针对文本排序输出可以采用sort命令,相关的常见选项为-r、-n、-k。其中-n表示按数字顺序升序排列,而-r表示反序,-k可以指定按第几个字段来排序

实现此案例需要按照如下步骤进行。

步骤一:统计Web访问量排名

分步测试、验证效果如下所述。

1)提取IP地址及访问量

2)对第1)步的结果根据访问量排名

案例4:编写监控脚本

本案例要求编写脚本,实现计算机各个性能数据监控的功能,具体监控项目要求如下:

CPU负载

网卡流量

内存剩余容量

磁盘剩余容量

计算机账户数量

当前登录账户数量

计算机当前开启的进程数量

本机已安装的软件包数量

步骤

实现此案例需要按照如下步骤进行。

步骤一:准备工作

1)查看性能数据的命令

步骤二:编写参考脚本

1)脚本内容如下:

awk格式:前面接触到的awk的输出功能,是{print}的功能,只能对文本简单的输出,并不能美化或修改格式

printf格式化输出:对文本格式化输出

printf和print的区别:format的使用

要点

1、其与print命令的最大不同是,printf需要指定format

2、format用于指定后面的每个item的输出格式

3、printf语句不会自动打印换行符;\nprint默认添加空格换行符

format格式的指示符都以%开头,后跟一个字符

%c 显示字符的ASCII码

%d, %i 十进制整数

%e, %E 科学计数法显示数值

%f 显示浮点数

%g, %G 以科学计数法的格式或浮点数的格式显示数值

%s 显示字符串

%u 无符号整数

%% 显示%自身

printf修饰符

- 左对齐;默认右对齐

+ 显示数值符号;printf "%+d"

给printf添加格式

格式化字符串%s代表字符串的意思

awk '{printf "%s\n",$1}' file

对对个变量进行格式化

当我们使用Linux命令printf时,一个%s格式替换符,可以对多个参数进行重复格式化

printf "%s\n" a b c d

然而awk的格式替换符想要修改多个变量,必须传入多个

awk 'BEGIN{printf "%d\n%d\n%d\n%d\n%d\n",1,2,3,4,5}'

注意awk不跟上文件数据,必须添加BEGIN, %d代表的是十进制数字

awk通过空格切割文档,printf动作对数据格式化输出

awk '{printf "第一列:%s第二列:%s第三列:%s\n", 2,$3}' file

对pwd.txt进行格式化输出

awk -F ":" 'BEGIN{printf

"%-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %-25s\n",

"用户名","密码","UID","GID","用户注释","用户家目录","用户使用的解释器"}

{printf "%-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %s\n",

2, 4, 6,$7}'

pwd.txt

参数解释

'BEGIN{printf "格式替换符 格式替换符2","变量1","变量2"}' 执行BEGIN模式

"%-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %-25s\n" 先打印第一行信息

%s是格式替换符 ,替换字符串

%s\t 格式化字符串后,添加制表符,四个空格

%-25s 已然是格式化字符串, - 代表左对齐 ,25个字符长度

printf对输出的文本不会换行,必须添加对于的格式替换符和\n

使用printf动作,'{printf "%s\n",$1}',替换的格式和变量之间得有逗号

使用printf动作,%s %d 等格式化替换符,必须和被格式化的数据一一对应

awk命令是Alfred Aho, Peter Weinberger, Brian Kernighan三位作者联合开发的,用于Linux/Unix中处理数据和产生报告。awk命令功能十分强大,可根据需要抓取、截取指定的列或行。

首先在/mnt目录下创建示例文本文件f1,其内容如下:

1 hello hello

2 data data

3 xyz abc

4 123 789

5 ftp

6 Apache

7 apache

然后,使用awk对f1文件内容进行处理,举例如下。

①awk -F " " '{print $2,$3}' f1:截取显示文档的第二列和第三列,-F指定分隔符为空格,$表示显示第几列。其中print表示要做输出信息的动作,$2和$3表示要输出的列号,awk要求将print已经输出列等内容放在“'{}'”之间。

②awk -F " " '($1>3){print $2,$3}' f1:选取第一列的值大于3的行,显示其第二列和第三列,在“()”中指定筛选条件。

③awk 'NR==4 || NR==3' f1:显示第三行和第四行,NR表示行号。

④awk '/data/ {print $2}' f1:抓取包含指定字符的行,再对列进行截取。此例中,awk先按照“data”字符串对文件f1中的行筛选,找出包含“data”的行以后,再按照默认的空格作为分隔符对行的内容做切割,仅打印出第二列的内容。

⑤awk '$2 ~ /data/ ' f1:抓取第二列包含指定字符的行。其中“~”表示是否匹配指定的“data”,如果第二列的内容包含“data”就打印出整行内容。

⑥awk '$2 !~ /data/ ' f1:抓取第二列不包含指定字符的行。其中“!~”表示是否不匹配指定的“data”,如果第二列的内容不包含“data”就打印出整行内容。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/8557650.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-18
下一篇2023-04-18

发表评论

登录后才能评论

评论列表(0条)

    保存