Linux命令之grep和awk

我们知道grep是查找命令,这是最基础的用法,那其他用法呢,这里记录2个

//反向查找
//查找test.txt文件中 不包含aa的行
grep -v "aa" test.txt

//匹配多个 //查找test.txt中不包含aa和bb的行 grep -vE "aa|bb" text.txt

awk也是Linux中很强的一个命令

test_1.txt 内容
北京    beijing    5
上海    shanghai    6

//用|分割每行内容 //下面awk命令即  用\t(制表符)分割每行数据  然后$1 $2 $3分别代表被分割出来的内容,然后将新内容输出到new_test_1.txt文件中 awk -F"\t" '{print $1"|"$2"|"$3}' test_1.txt > new_test_1.txt

awk实现分组统计

举例:
以下为待分析内容:

北京|少年|23
河北|少年|15
北京|青年|35
上海|少年|6
北京|中年|19
上海|青年|28

三列分别为地区、年龄段、去过城市个数

一、根据某列进行分组计数

根据地区统计人数

cat test.txt|awk -F '|' '{x[$1]++;} END{for(i in x) print(i ":" x[i])}'

结果如下:

上海:2
河北:1
北京:3

二、根据某列对另一列进行分组求和

根据年龄段统计去过城市个数

 cat test.txt|awk -F '|' '{x[$2]+=$3;} END{for(i in x) print(i ":" x[i])}'

结果如下:

青年:63
中年:19
少年:44

三、根据限定条件进行分组计数或求和

统计北京地区的不同年龄段去过的城市个数

cat test.txt|awk -F '|' '{if($1=="北京") {x[$2]+=$3;}} END{for(i in x) print(i ":" x[i])}'

结果如下

青年:35
中年:19
少年:23

参考资料:linux通过awk命令实现分组统计(计数、求和)实现group by功能_Knightley_K的博客-CSDN博客_linux 两列分组统计

暂无评论

发送评论 编辑评论


				
上一篇
下一篇