
首先,也是很重要的一步,就是下载jar包,丢到libs里面
Android studio玩家可以不下载jar包,在Gradle里面加入
dependencies {undefined
compile 'orgjsoup:jsoup:192'
}复制代码
然后,找到你心仪的网页去抓取数据
这里我们我继续使用美食的网页,然后右键查看网页源码,或者按F12,接下来可以看到一大堆标签:
Paste_Imagepng
找到需要的,例如上图这个 “美食天下” ,可以看到 “美食天下” 是放在以
为节点的 中,要获取这个“美食天下”,代码可以这样写:
try {undefined
//从一个URL加载一个Document对象。
Document doc = Jsoupconnect(">
这几天正在研究。废话不多说,直接上代码,自己研究的,通过迭代抓取。pageList就是抓取的分页页面的全部链接地址 。
其中Document doc = NetUtilsgetDocument(url);是jsoup抓取页面的基本 *** 作。
public class HtmlAnalsysTest3 {
static String url = ">
Document doc= Jsoupconnect("your_url")get(); //通过url获取html页面
Elements ListClass = docgetElementsByAttributeValue("class","your_class_name"); //通过class属性获取元素集合
for (Element element :ListClass) {
Elements divs = elementgetElementsByTag("div"); //获取div
for (Element div: divs) {
String divText = divtext()trim();
Systemoutprintln(divText);
}
}
以上就是关于android studio 怎么抓去网页媒体资源全部的内容,包括:android studio 怎么抓去网页媒体资源、jsoup爬虫怎么获取可点击并转到的文字、使用jsoup抓取分页的问题等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)