linux命令对某一列去重统计

linux命令对某一列去重统计,第1张

cat file.csv | awk -F '\t' '{print $2}'

'\t'指的是file.csv不同列以'\t'分割,如果的是以其他符号分割,换成其她符号;

'{print $2}'是指取第2列,此处从1开始计数,第1列,第2列;

一般去重之前要进行排序

cat file.csv | awk -F '\t' '{print $2}' | sort | uniq

前半部分与命令1一样,后面加上| sort | uniq

比如通过命令2发现,第2列取值有两种,分别是'neg'和‘pos’,那么我想知道有多少行的第2列取值为'pos',多少行的第2列取值为'neg'。

cat file.csv | awk -F '\t' '{print $2}' | grep -o 'neg'| wc -l

前半部分与命令1一样,后面加上 | grep -o 'neg'| wc -l

grep -o 'neg'就是取出取值为'neg'的行

wc -l 是计数有多少行

1、使用vim编辑器来打开文件

2、来看第一种方式,删除文件中指定的行,当使用vim打开文件的时候,页面的右下角会显示出当前光标的位置,比如光标停在第一排5的位置,右下角显示的就是1-5。

3、然后就可以根据这个字符找到指定的列,在vim编辑器的普通模式下,按下键盘上的x键,就会删除这个字符。然后再移动 j 键,光标就会移动到下一行,就这样依次按下j 、x键,就能很快删除不同行中的同一列。

4、还有一种方法,将光标移动到未删除的第5列数字上,然后在键盘上按下ctrl+v键。如下面图中所示,编辑页面的左下角会出现一个VISUAL BLOCK字样。。

5、然后这时,再按键盘上的 j 键往下移动,这个时候会发现,所有第5列的字符都被选中了。

6、这个时候再按删除的 x 键,第5列的字符就瞬间被删除了。就完成了。

1.grep -Ei XXX

-E    使用多字符匹配

-i    忽略大小写

2.fdisk -l |grep Disk

通过fdisk -l 查看机器所挂硬盘个数及分区情况

3.mkfs.ext4 /dev/sdb

把第二块硬盘整个格式化成ext4文件系统!同时会覆盖掉原来到分区表!

4.blkid /dev/sdb

blkid主要用来对系统的块设备(包括交换分区)所使用的文件系统类型、LABEL、UUID等信息进行查询。要使用这个命令必须安装e2fsprogs软件包

5. vim /etc/fstab

某些时候当Linux系统下划分了新的分区后,需要将这些分区设置为开机自动挂载,否则,Linux是无法使用新建的分区的。 /etc/fstab 文件负责配置Linux开机时自动挂载的分区。

Windows的文件结构是多个并列的树状结构,最顶部的是不同的磁盘(分区),如:C,D,E,F等。Linux的文件结构是单个的树状结构。最顶部的为根目录,即/。在根目录下,分为多个子目录,包括/bin、/boot、/dev、/etc、/home、/lib、/media、/mnt、/opt、/proc、/root、/sbin、/tmp、/usr和/var等。

磁盘Linux分区都必须挂载到目录树中的某个具体的目录上才能进行读写 *** 作,而fstab正是负责这一配置。显然,根目录是所有Linux的文件和目录所在的地方,需要挂载上一个磁盘分区。上面还提到,Linux分区交换也需要独立使用一个分区,因此,安装一个Linux至少需要两个分区。(事实上,只使用一个分区安装Linux也是可能的,而且,如果电脑的物理内存足够大,交换分区并不是必须的)

第一列可以是实际分区名,也可以是实际分区的卷标(Lable)。

第二列是挂载点。

第三列为此分区的文件系统类型。

第四列是挂载的选项,用于设置挂载的参数。

常见参数如下:

auto: 系统自动挂载,fstab默认就是这个选项

defaults: rw, suid, dev, exec, auto, nouser, and async.

noauto 开机不自动挂载

nouser 只有超级用户可以挂载

ro 按只读权限挂载

rw 按可读可写权限挂载

user 任何用户都可以挂载

请注意光驱和软驱只有在装有介质时才可以进行挂载,因此它是noauto

第五列是dump备份设置。

当其值设置为1时,将允许dump备份程序备份;设置为0时,忽略备份 *** 作;

第六列是fsck磁盘检查设置。

其值是一个顺序。当其值为0时,永远不检查

而 / 根目录分区永远都为1。其它分区从2开始,数字越小越先检查,如果两个分区的数字相同,则同时检查。

6. ip addr 查看ip地址

  service network restart重启网卡

  cd /etc/sysconfig/network-scripts/  进入网卡配置目录

7. systemctl 用来管理linux系统和服务

查看系统状态

#systemctl status

马上激活单元

# systemctl start <单元>

马上停止单元

# systemctl stop <单元>

重新启动单元

# systemctl restart <单元>

又一次载入配置

# systemctl reload <单元>

输出单元执行状态

$ systemctl status <单元>

检查单元是否配置为自己主动启动

$ systemctl is-enabled <单元>

开机自己主动激活单元

# systemctl enable <单元>

取消开机自己主动激活单元

# systemctl disable <单元>

8.ps aux|grep xxx 显示所有进程和其状态。

a 显示现行终端机下的所有程序,包括其他用户的程序。

u  以用户为主的格式来显示程序状况

x  显示所有程序,不以终端机来区分。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/8968056.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-23
下一篇2023-04-23

发表评论

登录后才能评论

评论列表(0条)

    保存