java爬虫读取某一张指定图片的url,求解答

java爬虫读取某一张指定图片的url,求解答,第1张

使用jsoup解析到这个url就行,dom结构如下:

look-inside-cover类只有一个,所以直接找到这个img元素,获取src属性,就可以获取到路径。

代码实现如下:

Document doc = Jsoupconnect("");

jsoup的jar包分享给你:

requestgetRequestDispatcher(url2)forward(request, response);

然后获取url2的数据用 reqgetAttribute("name");

import javaioBufferedReader;

import javaioFile;

import javaioFileReader;

/

@author lmq

/

public class RemoteFile {

public static void main(String[] args) throws Exception {

File remoteFile = new File("//1921687146/test/1txt");// 1921687146是对方机器IP,test是对方那个共享文件夹名字,如果没有共享是访问不到的

//远程文件其实主要是地址,地址弄对了就和本地文件没什么区别 ,windows里面//或者\\\\开头就表示这个文件是网络路径了其实这个地址就像我们再windows里面,点击开始

//然后点击运行,然后输入 \\1921687146/test/1txt访问远程文件一样的

BufferedReader br = new BufferedReader(new FileReader(remoteFile));

String str;

while ((str = brreadLine()) != null) {

Systemoutprintln(str);

}

brclose();

}

}

在>

public static String SendGET(String url,String param){

   String result="";//访问返回结果

   BufferedReader read=null;//读取访问结果

   

   try {

    //创建url

    URL realurl=new URL(url+""+param);

    //打开连接

    URLConnection connection=realurlopenConnection();

     // 设置通用的请求属性

             connectionsetRequestProperty("accept", "/");

             connectionsetRequestProperty("connection", "Keep-Alive");

             connectionsetRequestProperty("user-agent",

                     "Mozilla/40 (compatible; MSIE 60; Windows NT 51;SV1)");

             //建立连接

             connectionconnect();

          // 获取所有响应头字段

             Map<String, List<String>> map = connectiongetHeaderFields();

             // 遍历所有的响应头字段,获取到cookies等

             for (String key : mapkeySet()) {

                 Systemoutprintln(key + "--->" + mapget(key));

             }

             // 定义 BufferedReader输入流来读取URL的响应

             read = new BufferedReader(new InputStreamReader(

                     connectiongetInputStream(),"UTF-8"));

             String line;//循环读取

             while ((line = readreadLine()) != null) {

                 result += line;

             }

   } catch (IOException e) {

    eprintStackTrace();

   }finally{

    if(read!=null){//关闭流

     try {

      readclose();

     } catch (IOException e) {

      eprintStackTrace();

     }

    }

   }

    

   return result; 

 }

1、URI是统一资源标识符,是一个用于标识某一互联网资源名称的字符串。 该种标识允许用户对任何(包括本地和互联网)的资源通过特定的协议进行交互 *** 作。URI由包括确定语法和相关协议的方案所定义。由是三个组成部分:访问资源的命名机制、存放资源的主机名、资源自身的名称,由路径表示。

比如文件的URL,服务器方式用file表示,后面要有主机IP地址、文件的存取路径(即目录)和文件名等信息。有时可以省略目录和文件名,但“/”符号不能省略。

例:file://a:1234/b/c/dtxt代表获取资源使用ftp协议,资源目标是a主机的1234端口的b目录下的c目录下的dtxt。

2、URL是统一资源定位,是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。

以上就是关于java爬虫读取某一张指定图片的url,求解答全部的内容,包括:java爬虫读取某一张指定图片的url,求解答、请教大神。java里如何获得请求转发的url、java 读取远程url文件等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9518662.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-29
下一篇2023-04-29

发表评论

登录后才能评论

评论列表(0条)

    保存