求助：如何从网页中提取需要的数据，用JAVA实现_框架

我想你应该是想通过这个页面的url来得到这个网页里面的某些数据把。用>

新浪的那个天气的值是通过js动态加载的，原始html页面是<div id="SI_Weather_Wrap" class="now-wea-wrap clearfix"></div> 。

而jsoup只是对html进行解析，所以是找不到js动态生成的哪些信息的。

那些在页面上显示的数据，其实并不在页面，而是在数据库里。

数据库一般有个ID号字段。可以唯一标志一行记录

显示页面实际是个查询页面，把每一行记录都显示出来。例如你可以在每一行记录加一个删除按钮。将这个按钮和这行记录的ID号关联起来（这当然是个特循环的过程）

<a href="abcjspid=<%=rsgetInt("id")%>">sdf</a>点击这个链接就会向abcasp传递一个ID号，跟据这个ID就可以知道所有数据了

其实分不分页也无所谓，你也不必知道当前是那页，因为相当于你把每一行的记录都标了号，并且和数据库里的一一对应。

import javaioBufferedReader;

import javaioInputStreamReader;

import javanet>

把下面代码复制到文本文档中，然后将文本文档改成"html"形式

这个是提取表格中的数据的方法，看看是你想要的不

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 40 Transitional//EN">

<HTML>

<HEAD>

<TITLE> New Document </TITLE>

<META name="description" content="我想你应该是想通过这个页面的url来得到这个网页里面的某些数据把。用>新浪的那个天气的值是通过js动态加载的，原始html页面是<div id="SI_Weather_Wrap" class="no">

</HEAD>

<!--

//获得table的tr td等属性

function getTableAtt(){

alert('该table有'+documentalloTablessrowslength+'个tr')

for (i=0; i < documentalloTablessrowslength; i++) {

//循环每个tr里的td

for (j=0; j < documentalloTablessrows(i)cellslength; j++) {

alert('第'+(i+1)+'个tr中的第'+(j+1)+'个td的值为:'+documentalloTablessrows(i)cells(j)innerText)

}

//-->

</SCRIPT>

<BODY>

<hr>

</TABLE>

<hr>

</FORM>

</BODY>

</HTML>

以上就是关于求助：如何从网页中提取需要的数据，用JAVA实现全部的内容，包括:求助：如何从网页中提取需要的数据，用JAVA实现、java网页获取、java语言获取网页标签中的内容等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

求助：如何从网页中提取需要的数据，用JAVA实现