jsoup-从Wikipedia文章中提取文本

jsoup-从Wikipedia文章中提取文本,第1张

jsoup-从Wikipedia文章中提取文本
document doc = Jsoup.connect("http://en.wikipedia.org/wiki/Boston").get();Element contentDiv = doc.select("div[id=content]").first();contentDiv.toString(); // The result

当然,您可以通过这种方式检索格式化内容。如果您想要“原始”内容,则可以使用

Jsoup.clean
或使用call
过滤结果
contentDiv.text()



欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/5165012.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-11-18
下一篇2022-11-18

发表评论

登录后才能评论

评论列表(0条)

    保存