利用Jsoup获取具体标签属性值

利用Jsoup获取具体标签属性值,第1张

docselect("meta[name=description]"),get(0)attr("content")

大致是这么写的,你可以研究一下JSOUP的选择器,

chenying99/archive/2013/01/04/2844615,html" target="_blank">>

要取得一个属性的值,可以使用Nodeattr(String key) 方法

对于一个元素中的文本,可以使用Elementtext()方法

对于要取得元素或属性中的HTML内容,可以使用Elementhtml(),或 NodeouterHtml()方法。

String html = "<div class=''aa" id="aa">

</div>";

Document doc = Jsoupparse(html);

Element link = docselect("div#>aa");//使用id

如果要获取div里面的其它节点直接docselect("div#>aa>p") id=p的节点。

获取所有双色球数据,但是返回的都是html页面,需要进行处理,最开始想着用dom4j处理,发现不可行。之后想着自己处理,但是又太麻烦了,然后找到了jsoup,使用起来非常简单。

*** 作、解析HTML格式的数据

jsoup的使用和dom4j非常类似,最开始都是先获得一个Document对象,然后获取需要的子元素或节点进行 *** 作,但是jsoup可以通过dom、css、和类似jquery的方法( 选择器 )来获取需要的数据。

选择器官方API

其他方法详见官方API

Node

Element

Elements

Whitelist官方API

新浪的那个天气的值是通过js动态加载的,原始html页面是<div id="SI_Weather_Wrap" class="now-wea-wrap clearfix"></div> 。

而jsoup只是对html进行解析,所以是找不到js动态生成的哪些信息的。

我们这款沙发是采用最高端的科技制造而成,d簧的d性抗压力都是最高标准。

而且海绵质量也特别过关,定制的时候都是高端产品,坐到沙发上的时候,d性很足,也不会她坐下去的时候舒适度真好,经过无数次实践验证过的,可以放心使用。

根据java网络编程相关的内容,使用jdk提供的相关类可以得到url对应网页的html页面代码。

针对得到的html代码,通过使用正则表达式即可得到我们想要的内容。

比如,我们如果想得到一个网页上所有包括“java”关键字的文本内容,就可以逐行对网页代码进行正则表达式的匹配。最后达到去除html标签和不相关的内容,只得到包括“java”这个关键字的内容的效果。

总结一下Jsoup提供的方法:

获取元素的有:

getElementById(String id)

getElementsByTag(String tag)

getElementsByClass(String className)

getElementsByAttribute(String key)

siblingElements(), firstElementSibling(), lastElementSibling(); nextElementSibling(), previousElementSibling()

parent(), children(), child(int index)

获取元素数据:

attr(String key) 获取属性

attr(String key, String value) 设置属性

attributes() 获取所有属性

id(), className() and classNames()

text() 获取文字内容

text(String value) 设置文字内容

html() 获取html内容

html(String value) 设置html内容

outerHtml()

data() 获取类似script,style的数据内容

tag() and tagName()

*** 作HTML内容:

append(String html), prepend(String html)

appendText(String text), prependText(String text)

appendElement(String tagName), prependElement(String tagName)

html(String value)

documentdocumentElement返回文档的根节点 documentactiveElement返回当前文档中被击活的标签节点 eventfromElement返回鼠标移出的源节点 eventtoElement返回鼠标移入的源节点 eventsrcElement返回激活事件的源节点

以上就是关于利用Jsoup获取具体标签属性值全部的内容,包括:利用Jsoup获取具体标签属性值、jsoup如何通过字符串抓取元素、jsoup 的使用等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9484915.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-28
下一篇2023-04-28

发表评论

登录后才能评论

评论列表(0条)

    保存