一段统计文本单词个数的shell代码,实在是看不懂,谁能帮着解释下~

一段统计文本单词个数的shell代码,实在是看不懂,谁能帮着解释下~,第1张

#!/bin/bash

if [ $# -ne 2 -a $# -ne 1 ];then                             #程序运行时若输入参数少于两个,则提示错误

echo "usage: 'basename $0' [n] Input_File"     #-ne表示不等于,-a表示与运算

echo                                                                 #用法:默认输入一个参数代表文件名,输入两

exit                                                                   #个参数第一个代表显示行数。

fi

if [ $# -eq 1 ]                     #如果输入一个参数,则默认显示行数为10行。

then

I_TOP=10

I_FILE=$1

fi

if [ $# -eq 2 ]                    #如果输入两个参数,则第一个为显示行数,第二个为要处理的文件。

then

I_TOP=$1

I_FILE=$2

fi

tr -sc "[A-Z][a-z]" "[\012]" < $I_FILE | \        #tr命令你可以自己查找一下帮助,大意是除了大小写字母之外的字符都转化为回车,<是输出重定向,|是管道符,\是续行符

tr "[A-Z]" "[a-z] " | \                      #大写转化成小写

sort | \                                         #重新排序

uniq -c | \                                    #uniq 的用法

sort -k1 -n -r | \                           #sort 的用法

head -$I_TOP | nl                      #输出

你这是要解析html,你可以使用WebClient类来下载一个页面的源代码;

然后可以使用正则表达式拼配解析,也可以使用第三方类库(HtmlAgilityPack、 HTMLParser)来解析!

以上就是关于一段统计文本单词个数的shell代码,实在是看不懂谁能帮着解释下~全部的内容,包括:一段统计文本单词个数的shell代码,实在是看不懂,谁能帮着解释下~、AsP.net采集到一个页面,怎么循环这个页面多个table,并且获得每个table里面的tr中td数据、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9526129.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-29
下一篇2023-04-29

发表评论

登录后才能评论

评论列表(0条)

    保存