linux下将文件按行分割的命令_系统运维

1）按2行切割 -l 2

2）指定切割后的文件前缀名 data_

3）指定切割后的文件后缀名为数字 -d

4）指定切割后的文件后缀名数字的长度 -a 4，即位宽（10进制），这里长度可根据切割出来的文件有多少估算，到底拆分为几个文件，由总行数，和每个文件的行数决定，不用指定。

如果为-a 4文件的后缀数字从0000开始计算，依次为0001，0002，0003，0004

split -l 2 data.log -d -a 4 data_

将文件data.log进行拆分，每个文件2行，如果文件总共有7行，则分为data_0000，data_0001，data_0002，data_0003

（自己）常用的文本文件的行处理命令

示例文件：test.vcf

1、head -n 10 test.vcf

head : 默认是提取文件的前10行，-n 参数可以设定选择文件的前n行

2、tial -n 10 test.vcf

tail : 默认是提取文件的末尾10行， -n 参数可以设定选择文件末尾的n行

3、sed -n '10,20p' test.vcf

sed -n ：随意选择需要查看的行

sed命令是一个面向行处理的编辑器，可以和正则表达式配合使用，附上较全面的sed命令使用教程。

https://man.linuxde.net/sed

4、awk 截取行的指定长度字符串

less test.gz |awk '{if(NR%2==1){print}else{print substr($1,1,75)}}' | gzip -c >test.part.gz

说明：对test.gz文件指定行截取75bp，原来是150bp

5、对n行的第三列求和，求平均值

grep -v ‘#’ test.vcf |sed -n '20,35p' |awk -F '\t' '{sum+=$3n++}END{print sum,sum/n}'

(linux 一行命令计算速度比Python快，简单计算喜欢用linux命令)

记得随时整理使用过的命令，没学过linux，靠着各种帖子，随时需要随时补给，有点懒。

欢迎分享，转载请注明来源：内存溢出

linux下将文件按行分割的命令