
刚学完新书《实用Linux Shell编程》,写的不错,容易懂,网上和书店都有卖。
现在试着回答,仅供参考,谢谢。
1)先保证文件内容正确:
2)文件1文件2只有唯一字符串,所以情况相对简单。脚本写好了,别忘了给脚本增加执行权限。
脚本简单地说就是一条条的文字命令,这些文字命令是可以看到的(如可以用记事本打开查看、编辑),脚本程序在执行时,是由系统的一个解释器,将其一条条的翻译成机器可识别的指令,并按程序顺序执行。因为脚本在执行时多了一道翻译的过程,所以它比二进制程序执行效率要稍低一些。
查询有关资料和专业人士交流可以知道,shell给一个文件中的每一行开头插入字符的方法:awk '{print "X"$0}' fileNameshell给一个文件中的每一行结尾插入字符的方法:awk '{print $0"X"}' fileName
shell给一个文件中的每一行的指定列插入字符的方法:awk '$O=$O" X"' fileName
需求:
由于hive表中有大量的临时表,所以决定要想删除它们,这些表全是以t_开头。
因为hive的shell客户端不支持以某个字符开头或以正则表达式删除表,要么一个一个删,要么使用Java程序查出来再删。
*** 作过程:
1.把表全显示出来
show tables
2.把你要的表名复制到一个文件中
3.给文件中的每一行开头添加drop tables
awk '{print "drop table "$0}' aa.txt >bb.txt
4.给文件中的每一行结尾添加分号
awk '{print $0""}' bb.txt >cc.txt
5.直接复制到hive的shell客户端执行即可
最后还是想用简单的脚本解决,发现使用 sed 命令可以方便得在文件每一行后添加一个字符。首先看一下 sed 命令。
sed 是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间” (pattern space) ,接着用 sed 命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有 改变,除非你使用重定向存储输出。 Sed 主要用来自动编辑一个或多个文件;简化对文件的反复 *** 作;编写转换程序等。
假设处理的文本为 test.file ,在每行的头添加字符,比如 HEAD ,命令如下:
在每行的行尾添加字符,比如 TAIL ,命令如下:
几点说明:
这样就处理完了!总之恰当使用sed命令是可以避免来回打开文件造成的时间浪费,可以使用sed命令在linux脚本中做一些更好玩的事情。希望这篇文章可以给你一些帮助~
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)