
nutch可以做到吧,但他是一个java框架,不过他提供了直接可执行脚本
你可以用shell来掉他脚本进行网页子站的抓取,然后处理。
本人对Shell无能为力
可以给你个思路
像这种都不是太难,甚至可以写死去分析一个网站的数据接口
访问:
>
自动抓取页面生成接口的方法?答:自动抓取页面生成接口的方法:第一步,将web前端页面的表格文件传输到后台并进行分布式存储,保障数据的容灾能力、备份以及后期的d性扩展;
第二步,对表格文件的数据信息进行分析和识别,并添加传入参数;
第三步,将添加传入参数后的数据导入数据库,自动生成接口信息;
第四步,web界面调用自动生成的接口,获取返回的数据信息即可得到查询结果。
$("a")attr("src"); //获取地址
$("a")text(); //获取text
如果获取别的网页一样可以用,获取到的是一个集合。处理一下就行
网页内调用开放的api接口实现用户定位的步骤如下:以百度地图为例
1、百度直接搜百度地图调用,点击出现的第二个网站,进入这个网站即可;
2、进入这个网站后,我们首先得输入自己需要定位的地点。比如我们输入上海这个城市,输入后点击查找选项;
3、经过上一步的 *** 作,我们已经成功地定位到上海这个城市了。然后我们点击第二步设置地图;
4、在设置地图里面有一些关于这个地图本身显示的一些设置选项,比如可以设置地图的尺寸大小,地图的添加按钮和地图的状态;;
5、然后我们开始给我们的地图添加地图标注,点击这个小棒子图标,然后在我们需要标注的地方鼠点击一下,输入需要修改的名称和备注,然后点击保存按钮;
6、经过上面的一些 *** 作后,我们可以看到我们自己添加的地理位置所显示出的效果了;
7、然后我们点击底部的获取代码,再点击复制代码即可;
8、在vs2012里面新建一个html文件,然后把我们刚刚复制过来的代码直接粘贴到里面。然后在vs2012里面选择使用谷歌浏览器查看这个html文件里面的内容;;
9、这个是在谷歌浏览器里面运行出来的,在本地的百度地图显示出地理位置的效果图。可以看到,我们已经成功地调用了百度地图的API接口了。
以上就是关于是否有办法能获取到一个主网页下的所有子网页的网址,以及处理数据的接口地址全部的内容,包括:是否有办法能获取到一个主网页下的所有子网页的网址,以及处理数据的接口地址、WebApi中,怎么获取接口调用者的外网ip地址、获取本机IP的http接口等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)