
我想你应该是想通过这个页面的url来得到这个网页里面的某些数据把。用>
新浪的那个天气的值是通过js动态加载的,原始html页面是<div id="SI_Weather_Wrap" class="now-wea-wrap clearfix"></div> 。
而jsoup只是对html进行解析,所以是找不到js动态生成的哪些信息的。
那些在页面上显示的数据,其实并不在页面,而是在数据库里。
数据库一般有个ID号字段。可以唯一标志一行记录
显示页面实际是个查询页面,把每一行记录都显示出来。例如你可以在每一行记录加一个删除按钮。将这个按钮和这行记录的ID号关联起来(这当然是个特循环的过程)
<a href="abcjspid=<%=rsgetInt("id")%>">sdf</a>点击这个链接就会向abcasp传递一个ID号,跟据这个ID就可以知道所有数据了
其实分不分页也无所谓,你也不必知道当前是那页,因为相当于你把每一行的记录都标了号,并且和数据库里的一一对应。
import javaioBufferedReader;
import javaioInputStreamReader;
import javanet>
把下面代码复制到文本文档中,然后将文本文档改成"html"形式
这个是提取表格中的数据的方法,看看是你想要的不
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 40 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<META NAME="Generator" CONTENT="EditPlus">
<META NAME="Author" CONTENT="">
<META name="keywords" content="数据,页面,网页,是个,相关内容">
<META name="description" content="我想你应该是想通过这个页面的url来得到这个网页里面的某些数据把。用>新浪的那个天气的值是通过js动态加载的,原始html页面是<div id="SI_Weather_Wrap" class="no">
</HEAD>
<SCRIPT LANGUAGE="JavaScript">
<!--
//获得table的tr td等属性
function getTableAtt(){
alert('该table有'+documentalloTablessrowslength+'个tr')
for (i=0; i < documentalloTablessrowslength; i++) {
//循环每个tr里的td
for (j=0; j < documentalloTablessrows(i)cellslength; j++) {
alert('第'+(i+1)+'个tr中的第'+(j+1)+'个td的值为:'+documentalloTablessrows(i)cells(j)innerText)
}
}
}
//-->
</SCRIPT>
<BODY>
<FORM METHOD=POST ACTION="" name="myform">
<hr>
<TABLE ID=oTabless border = "1">
<TR><TD>1</TD><TD>2</TD><TD>3</TD><TD>4</TD></TR>
<TR><TD>5</TD><TD>6</TD><TD>7</TD><TD>8</TD></TR>
</TABLE>
<INPUT TYPE="button" VALUE="Table" onclick="getTableAtt()">
<hr>
</FORM>
</BODY>
</HTML>
以上就是关于求助:如何从网页中提取需要的数据,用JAVA实现全部的内容,包括:求助:如何从网页中提取需要的数据,用JAVA实现、java网页获取、java语言获取网页标签中的内容等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)