
然后,我们先打开Instagram网站,确认能打开就表明正常**。由于本期主要爬取,所以特意选取了一个美女的Instagram为例子,尺度不高,我们打开Chrome F12的调试功能,点选中Network Tab页。
个人首页
按照惯例,首先检查index页面的HTML文件中是否存在链接。
缩略图
这里我们复制class = _mck9w _gvoze _f2mse的字符串去Source Tab页下查找,发现并没有结果,将之拷贝出来,发现里面的内容都是动态生成的。
Source页面下的首页HTML
这就不得不怀疑,是不是所有的数据都以其他形式放在首页HTML文件中,或者通过Ajax异步请求过来。我们从Network中随便拷贝一张的链接,如下,然后放到HTML文件中搜索,结果出现了。
notepad++中搜索出了3条记录
搜索记录过程中,我们发现了一个惊喜的地方,那就是被script包裹在里面的windows_shareData,的链接就在里面,难得可贵的就是数据格式还是json格式的,我们单独提取出来format一下。
json数据块
真正的URL就在nodes数据中,这可是个极大的好消息。
代码
# -- coding: utf-8 --
import json
from lxml import etree
import requests
import click
headers = {
"Origin": ">
实现代码如下:
1<html>
2 <head>
3 <title>selenium处理基本页面元素</title>
4 <style type="text/css">
5 table{font-size:26;text-align:center;width:80%;border-collapse:collapse;margin:auto}
6 table th{background: #aff}
7 display{color:red}
8 widgetStyle{text-align:left;padding-left:100px}
9 </style>
10 <script language= "javascript" type="text/javascript">
11 function clickbutton(flag)
以上就是关于python判断instagram是否有头像全部的内容,包括:python判断instagram是否有头像、如何在程序中处理reCAPTCHA、selenium怎么输出某页面元素的值等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)