
获取所有双色球数据,但是返回的都是html页面,需要进行处理,最开始想着用dom4j处理,发现不可行。之后想着自己处理,但是又太麻烦了,然后找到了jsoup,使用起来非常简单。
*** 作、解析HTML格式的数据
jsoup的使用和dom4j非常类似,最开始都是先获得一个Document对象,然后获取需要的子元素或节点进行 *** 作,但是jsoup可以通过dom、css、和类似jquery的方法( 选择器 )来获取需要的数据。
选择器官方API
其他方法详见官方API
Node
Element
Elements
Whitelist官方API
Document doc = Jsoupparse(html),html就是指包含你需要的div的那段html代码,然后再Elements el = docselect("div"),如果这个div有class=abc,或者id=abc,或者其它的属性attr=abc,那么你就这么选,docselect("div[AttrName=abc]"),AttrName就是指class,id或者其它的属性名称,百度回答不允许直接贴链接,所以你最好再搜索下Jsoup的API,读一读,Selector类的文档有实例
public void parse(){
String htmlStr = "<table id=kbtable >"
+ "<tr> "
+ "<td width=123>"
+ "<div id=12>这里是要获取的数据1</div>"
+ "<div id=13>这里是要获取的数据2</div>"
+ "</td>"
+ "<td width=123>"
+ "<div id=12>这里是要获取的数据3</div>"
+ "<div id=13>这里是要获取的数据4</div>"
+ "</td> "
+ "</tr>"
+ "</table>";
Document doc = Jsoupparse(htmlStr);
// 根据id获取table
Element table = docgetElementById("kbtable");
// 使用选择器选择该table内所有的<tr> <tr/>
Elements trs = tableselect("tr");
//遍历该表格内的所有的<tr> <tr/>
for (int i = 0; i < trssize(); ++i) {
// 获取一个tr
Element tr = trsget(i);
// 获取该行的所有td节点
Elements tds = trselect("td");
// 选择某一个td节点
for (int j = 0; j < tdssize(); ++j) {
Element td = tdsget(j);
// 获取td节点的所有div
Elements divs = tdselect("div");
// 选择一个div
for (int k = 0; k < divssize(); k++) {
Element div = divsget(k);
//获取文本信息
String text = divtext();
//输出到控制台
Systemoutprintln(text);
}
}
}
}
提示的很清楚了,helloAction类找不到。先不要用注入的方式试一下,如果可以,那就是你Spring配置的问题;如果不可以,那就是你Struts2没配对
请采纳答案,支持我一下。
Jsoup从Html文件中提取正文内容
示例代码:
File input = new File("/tmp/inputhtml");
Document doc = Jsoupparse(input, "UTF-8", "/examplecom/");
Element content = docgetElementById("content");
Elements links = contentgetElementsByTag("a");
for (Element link : links) {
String linkHref = linkattr("href");
String linkText = linktext();
}
jsoup是一款Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的 *** 作方法来取出和 *** 作数据。
jsoup的主要功能如下:
1 从一个URL,文件或字符串中解析HTML;
2使用DOM或CSS选择器来查找、取出数据;
3 可 *** 作HTML元素、属性、文本;
以上就是关于jsoup 的使用全部的内容,包括:jsoup 的使用、jsoup 怎么拿某个div下的的内容、jsoup解析html的table中的内容等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)