linux下数据压缩的几种方法与查看方式

linux下数据压缩的几种方法与查看方式,第1张

1. tar命令

使用tar程序打出来的包我们常称为tar包. tar包文件的命令通常都是以.tar结尾的。生成tar包后. 就可以用其它的程序来进行压缩了. tar命令本身不进行数据压缩. 但可以在打包或解包的同时调用其它的压缩程序. 比如调用gzip、bzip2

    选项:

-c 创建.tar格式包文件

-x 解开.tar格式包文件

-v显示详细信息

-f 使用归档文件

-p 保留原始文件权限

-C 解压到目标文件夹

-z 调用gzip进行压缩或解压

-j 调用bzip2进行压缩或解压

    打包示例: 

  tar -cvf /blog/uouo123/com.tar bb.txt 打包文件

    打包并压缩示例:

tar -zcvf /blog/uouo123/com.tar.gz bb.txt 压缩文件

    解压缩示例:

tar -zxvf /blog/uouo123/com.tar.gz -C /com/bb 解压文件

2. gzip压缩

    常用数据压缩命令. 压缩比例可手工调整.   压缩后文件名 filename.gz:

        注:压缩后文件可直接load至hive数据库. 但每个文件只会产生一个map. 查询效率极低

选项:

-c 将输出写到标准输出上. 并保留原有文件。

-d 将压缩文件解压。

-l 对每个压缩文件. 显示下列字段:

压缩文件的大小;未压缩文件的大小;压缩比;未压缩文件的名字

-r 递归式地查找指定目录并压缩其中的所有文件或者是解压缩。

-t 测试. 检查压缩文件是否完整。

-v 对每一个压缩和解压的文件. 显示文件名和压缩比。

-num 用指定的数字 num 调整压缩的速度. -1 或 --fast 表示最快压缩方法(低压缩比).

-9 或--best表示最慢压缩方法(高压缩比)。系统缺省值为 6。

压缩示例:

gzip filename

    查看gzip压缩文件内容命令:     

    zcat filename.gz

     解压缩命令:

gzip -d filename.gz

    压缩过程中可控制压缩率(1-9). 1压缩最快. 压缩率不高. 9压缩最慢. 压缩比例最高. 缺省为6. 例如:

    gzip -9 filename

3. bzip2压缩

    常用数据压缩命令. 压缩比例比gzip高. 压缩后文件名为filename.bz2

        注:压缩后文件可直接load至hive数据库

    选项

-c或——stdout:将压缩与解压缩的结果送到标准输出;

-d或——decompress:执行解压缩;

-f或-force:bzip2在压缩或解压缩时. 若输出文件与现有文件同名. 预设不会覆盖现有文件。若要覆盖。请使用此参数;

-h或——help:在线帮助;

-k或——keep:bzip2在压缩或解压缩后. 会删除原始文件。若要保留原始文件. 请使用此参数;

-s或——small:降低程序执行时内存的使用量;

-t或——test:测试.bz2压缩文件的完整性;

-v或——verbose:压缩或解压缩文件时. 显示详细的信息;

-z或——compress:强制执行压缩;

-V或——version:显示版本信息;

--repetitive-best:若文件中有重复出现的资料时. 可利用此参数提高压缩效果;

--repetitive-fast:若文件中有重复出现的资料时. 可利用此参数加快执行效果。

    压缩示例:

    bzip2 filename

    解压缩示例:

    bzip2 -d filename.bz2

    直接查看压缩文件示例:     

    bzcat filename.bz2

使用默认压缩情况下压缩性能:

    bzip2 >gzip >tar

用tar压缩压缩格式和工具有bzip2和gzip,你可以单独使用,也可以配合tar使用tar的主要的功能有-t 打印归档中的所用文件,并以列表的形式显示-c 归档压缩-x 打开归档和解开压缩压缩命令选项有: -j 选择bzip2压缩,压缩后的归档文件为 ***.tar.bz2 -z 选择gzip压缩,压缩后的文件为***.tar.gz其他压缩选项: -f 指定 归档文件 -v 打印 *** 作过程中的相信信息举例1: tar -cvzf 1.tar.gz 1.txt 2.txt 2.txt 将1.txt 2.txt 3.txt 压缩归档为1.tar.gz, 如果你想压缩成bzip2,将z换成j即可举例2: tar -xvzf 1.tar.gz 将1.tar.gz解压,如果文件是1.tar.bz2, 则将z换成j。 上述命令中 v选项可以去掉,v只是显示 *** 作过程中的信息举例3: tar -tvzf 1.tar.gz 显示1.tar.gz中的文件信息,但不解压,如果是 1.tar.bz2, 你知道该怎么办了吗?其中 bzip2 和gzip以单独对命令也可以使用,与tar类似,你可以用 man bzip2 和man gzip命令查看具体的说明。 就压缩而已,文本文件的压缩率很高,网上给出的参数是10%~15%,我本人感觉差不多是这样,二进制文件的压缩率不高。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/8585432.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-18
下一篇2023-04-18

发表评论

登录后才能评论

评论列表(0条)

    保存