如何用java中的 pattern类 获得 html中的数据

如何用java中的 pattern类 获得 html中的数据,第1张

值是数字吗,是的话就这段代码

public static void main(String[] args){

Pattern p = Patterncompile("guakao=(\\d+)\\'");

Matcher m = pmatcher("<a href=\"javascript:winopen('guakaojspguakao=101235','_blank',470,350)\">");

if(mmatches()){

Systemoutprintln(mgroup(1));

}

}

如果setAttribute()不可以,因为他是存储的一个对象放在一个哈希表进行返回,那么使用setParameter()直接类似于表单的名值对信息返回到前台也不可以吗

多数论坛提到是因为JavaScript是浏览器端,Servlet是服务器端但是我觉得这个答案完全没有说服力个人认为,requestsetAttribute()和setParameter()只是将数据存放在request请求中,从宏观来讲,这仅仅是一个>

新浪的那个天气的值是通过js动态加载的,原始html页面是<div id="SI_Weather_Wrap" class="now-wea-wrap clearfix"></div> 。

而jsoup只是对html进行解析,所以是找不到js动态生成的哪些信息的。

用jsoup框架 ,你可以百度搜索一下 ,这个框架很好用直接用select选择器来选择HTML里面的节点,比如<a class="title">hello</a> 你可以通过select("title")来得到hello这个字符串,当然这只是其中一种方法,还有很多方法,具体怎么用请看jsoup的官方文档。纯手打,采纳我吧

参考下面代码:

实现代码:

<form action="inputdo" name="formkk">

<table>

<tbody>

<tr>

<td>text:</td>

<td>

<input type="text" name="text">

</td>

</tr>

<tr>

<td>password:</td>

<td>

<input type="password" name="pass">

</td>

</tr>

<tr>

<td>radio:</td>

<td>

<input type="radio" name="xingbie" value="1">

<input type="radio" name="xingbie" value="2">

</td>

</tr>

<tr>

<td>checkbox:</td>

<td>

足球:<input type="checkbox" name="hobby" value="1" />

篮球:<input type="checkbox" name="hobby" value="2" />

拍球:<input type="checkbox" name="hobby" value="3" />

斗球:<input type="checkbox" name="hobby" value="4" />

</td>

</tr>

<tr>

<td>hidden:</td>

<td>

<input type="hidden" value="123" name="hidden"/>

</td>

</tr>

<tr>

<td>option:</td>

<td>

<select name="opt" id="opt">

<option>1</option>

<option>2</option>

<option>3</option>

<option>4</option>

</select>

</td>

</tbody>

</table>

<input type="button" value="提交" onclick="javascript:check()"/>

</form>String[] hobbys = requestgetParameterValues("hobby"); //checkbox

String text = requestgetParameter("text"); //text

String password = requestgetParameter("password"); //password

String xingbie = requestgetParameter("xingbie"); //radio

requestgetParameter("hidden");

requestgetParameter("opt"); //select

先获取页面

String html = getContent(url, ConstantsENCODING_UTF8);

解析页面 Document doc=Jsoupparse(html);

然后你获取相应的标签String tag =docgetElementsByTag("title")first()text();

如果标签很多不一样你就得判断了,还有看看有什么相同的地方吧,我抓取网页数据的时候最烦的就是格式不一样的,好多标签不一样的,只能判断,找到共同点,个别的单个处理,我做了好久了,我根本没想到别的更好的办法,如果你有更好的办法希望你告诉我,我的工作会快很多嘻嘻谢谢啊

以上就是关于如何用java中的 pattern类 获得 html中的数据全部的内容,包括:如何用java中的 pattern类 获得 html中的数据、Java:前台jsp获取后台传的html数据、java语言获取网页标签中的内容等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9695468.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-01
下一篇2023-05-01

发表评论

登录后才能评论

评论列表(0条)

    保存