
doc.select("meta[name=description]"),get(0).attr("content")
大致是这么写的,你可以研究一下JSOUP的选择器,
chenying99/archive/2013/01/04/2844615,html" target="_blank">http://www.cnblogs.com/chenying99/archive/2013/01/04/2844615.html
要取得一个属性的值,可以使用Node.attr(String key) 方法
对于一个元素中的文本,可以使用Element.text()方法
对于要取得元素或属性中的HTML内容,可以使用Element.html(),或 Node.outerHtml()方法。
jsoup可以解析出 js 的文件名,至于 js 文件里的内容,可以用程序下载能得到的,但这不是 jsoup 干的事。参考实例如下:
Elements els = doc.select("script")
for(Element el: els) {
//提取src信息
String src = el.attr("src")
//得到js的地址了,就可以下载了。比如外部css样式表也可以类似的方式取出来
}
可以,例如:在aa.html文档中: Document doc = Jsoup.parse(aa.html, "UTF-8", )1.获取input标签:Element inputElement=doc.getElementById("小小")2.获取name属性:inputElement.name 希望对你有所帮助欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)