
#!/bin/bash
if [ $# -ne 2 -a $# -ne 1 ];then #程序运行时若输入参数少于两个,则提示错误
echo "usage: 'basename $0' [n] Input_File" #-ne表示不等于,-a表示与运算
echo #用法:默认输入一个参数代表文件名,输入两
exit #个参数第一个代表显示行数。
fi
if [ $# -eq 1 ] #如果输入一个参数,则默认显示行数为10行。
then
I_TOP=10
I_FILE=$1
fi
if [ $# -eq 2 ] #如果输入两个参数,则第一个为显示行数,第二个为要处理的文件。
then
I_TOP=$1
I_FILE=$2
fi
tr -sc "[A-Z][a-z]" "[\012]" < $I_FILE | \ #tr命令你可以自己查找一下帮助,大意是除了大小写字母之外的字符都转化为回车,<是输出重定向,|是管道符,\是续行符
tr "[A-Z]" "[a-z] " | \ #大写转化成小写
sort | \ #重新排序
uniq -c | \ #uniq 的用法
sort -k1 -n -r | \ #sort 的用法
head -$I_TOP | nl #输出
你这是要解析html,你可以使用WebClient类来下载一个页面的源代码;
然后可以使用正则表达式拼配解析,也可以使用第三方类库(HtmlAgilityPack、 HTMLParser)来解析!
以上就是关于一段统计文本单词个数的shell代码,实在是看不懂,谁能帮着解释下~全部的内容,包括:一段统计文本单词个数的shell代码,实在是看不懂,谁能帮着解释下~、AsP.net采集到一个页面,怎么循环这个页面多个table,并且获得每个table里面的tr中td数据、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)