
Elements elestb = Jsoupselect("table");
Elelments elestr = elestbget(0)select("tr");
Elements eles= elestrget(1)select("a");
//第一个
String a1 = elestdget(0)text();
//第二个
String a2 = elestdget(1)text();
Elements elestd = elestrget(1)select("td");
//第三个
String td1 = elestdget(2)text();
//第四个
String td2 = elestdget(3)text();
HTMLParser 和 Jsoup 在 Web 页面提取方法上的差异使用方向和参数是不一样。
:
可能会觉得 jsoup 的方法似曾相识,没错,像 getElementById 和 getElementsByTag 方法跟 JavaScript 的方法名称是一样的,功能也完全一致。你可以根据节点名称或者是 HTML 元素的 id 来获取对应的元素或者元素列表。
与 htmlparser 项目不同的是,jsoup 并没有为 HTML 元素定义一个对应的类,一般一个 HTML 元素的组成部分包括:节点名、属性和文本,jsoup 提供简单的方法供你自己检索这些数据,这也是 jsoup 保持瘦身的原因。
Element ele = docgetElementById("id");//当根据id取单个元素的时候
if(ele==null){
Systemoutprintln("没有此元素")
}Elements eles = docgetElementsByClass("name");//当根据name之类,取多个元素的时候
if(elesisEmpty()){ //eles类似于集合,所以用isEmpty来判断
Systemoutprintln("没有class为name的元素集合")
}
Documentdoc=Jsoupconnect("your_url")get();//通过url获取html页面ElementsListClass=docgetElementsByAttributeValue("class","your_class_name");//通过class属性获取元素集合for(Elementelement:ListClass){Elementsdivs=elementgetElementsByTag("div");//获取divfor(Elementdiv:divs){StringdivText=divtext()trim();Systemoutprintln(divText);}}
documentdocumentElement返回文档的根节点 documentactiveElement返回当前文档中被击活的标签节点 eventfromElement返回鼠标移出的源节点 eventtoElement返回鼠标移入的源节点 eventsrcElement返回激活事件的源节点
以上就是关于菜鸟求教 java爬虫 Jsoup 查找元素 求教如何select出来这四个数据,谢谢!全部的内容,包括:菜鸟求教 java爬虫 Jsoup 查找元素 求教如何select出来这四个数据,谢谢!、HTMLParser 和 Jsoup 在 Web 页面提取方法上的差异、jsoup解析html时,若没有查找到相关标签,Element元素的返回值如何判断为空等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)