java中如何根据一个网址获得该网页的源代码_框架

package test;

import javaioBufferedReader;

import javaioInputStreamReader;

import javanet>

import javanetURL;

public class >

private String u;

private String encoding;

public static void main(String[] args) throws Exception {

clientrun();

}

public >

thisu = u;

thisencoding = encoding;

}

public void run() throws Exception {

URL url = new URL(u);// 根据链接（字符串格式），生成一个URL对象

openConnection();// 打开URL

BufferedReader reader = new BufferedReader(new InputStreamReader(

urlConnectiongetInputStream(), encoding));// 得到输入流，即获得了网页的内容

String line; // 读取输入流的数据，并显示

while ((line = readerreadLine()) != null) {

Systemoutprintln(line);

}

根据具体问题类型，进行步骤拆解／原因原理分析／内容拓展等。

具体步骤如下：／导致这种情况的原因主要是……

1进入百度主页，就以百度主页来演示，右键单击空白地方，然后源代码，。

2然后就会d出一个页面，，但是排版很乱，且这些都是动态生成的代码，用处不大。

3找到浏览器右上角，点击工具--开发人员工具，我们打开调试工具，也可以按快捷键F12，。

5在右边搜索框内可以搜索想要查询的html元素，即可。

可以参考以下几种方法：

方法一： file_get_contents获取

$url=">

$fh= file_get_contents

('>

方法二：使用fopen获取网页源代码

$url=">

$handle = fopen ($url, "rb");

$contents = "";

while (!feof($handle)) {

$contents = fread($handle, 8192);

}

fclose($handle);

echo $contents; //输出获取到得内容。

方法三：使用CURL获取网页源代码

$url=">

$UserAgent = 'Mozilla/40 (compatible; MSIE 70; Windows NT 60; SLCC1; NET CLR 2050727; NET CLR 3004506; NET CLR 3521022; NET CLR 103705; NET CLR 114322)';

$curl = curl_init(); //创建一个新的CURL资源

curl_setopt($curl, CURLOPT_URL, $url); //设置URL和相应的选项

curl_setopt($curl, CURLOPT_HEADER, 0); //0表示不输出Header，1表示输出

curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); //设定是否显示头信息,1显示，0不显示。//如果成功只将结果返回，不自动输出任何内容。如果失败返回FALSE

curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);

curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);

curl_setopt($curl, CURLOPT_ENCODING, ''); //设置编码格式，为空表示支持所有格式的编码

//header中“Accept-Encoding: ”部分的内容，支持的编码格式为："identity"，"deflate"，"gzip"。

curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);

curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);

//设置这个选项为一个非零值(象 “Location: “)的头，服务器会把它当做>

$data = curl_exec($curl);

echo $data;

//echo curl_errno($curl); //返回0时表示程序执行成功

curl_close($curl); //关闭cURL资源，并释放系统资源

PHP（外文名:PHP: Hypertext Preprocessor，中文名：“超文本预处理器”）是一种通用开源脚本语言。语法吸收了C语言、Java和Perl的特点，利于学习，使用广泛，主要适用于Web开发领域。PHP 独特的语法混合了C、Java、Perl以及PHP自创的语法。它可以比CGI或者Perl更快速地执行动态网页。

用PHP做出的动态页面与其他的编程语言相比，PHP是将程序嵌入到HTML（标准通用标记语言下的一个应用）文档中去执行，执行效率比完全生成HTML标记的CGI要高许多；PHP还可以执行编译后代码，编译可以达到加密和优化代码运行，使代码运行更快。

参考资料：

PHP（超文本预处理器)-百度百科

以上就是关于java中如何根据一个网址获得该网页的源代码全部的内容，包括:java中如何根据一个网址获得该网页的源代码、怎么获取网页源代码中的文件、php获取网页源码内容有哪些办法等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/web/10074663.html

java中如何根据一个网址获得该网页的源代码

发表评论

评论列表（0条）