python爬虫获取有负载内容

python爬虫获取有负载内容,第1张

主要使用selenium+chrome,加了Tkinter的简单GUI,代码比较简单,就不细说了,请自行品味:

获取qq好友列表

这个是从QQ充值获取的,可得"原始数据",“分组”,“显示名”,“QQ号”:

import selenium

from selenium import webdriver

from seleniumwebdriverchromeoptions import Options

import tkinter as tk

from tkinterfiledialog import asksaveasfilename

from bs4 import BeautifulSoup

import lxml

import openpyxl

from openpyxl import Workbook

def callback():

driverswitch_to_frame('webpay-iframe')

iframe =driverfind_element_by_xpath('//[@id="midas-webpay-main-1450000186"]/div[2]/div[1]/iframe')

driverswitch_to_frame(iframe)

html=driverpage_source

soup=BeautifulSoup(html,"lxml")

a=soupfind_all(attrs={'class':'icon-friend-s'})

wb = Workbook()

ws = wbactive

wsappend(["原始数据","分组","显示名","QQ号"])

for i in a:

if inext_sibling !=' {undefined{elname}}({undefined{elqq}})':

#re,qq匹配:

#pattern = recompile(r'[1-9][0-9]{4,}')

#re,括号匹配:

#pattern = recompile(r'(<=)∗(=)∗(=)')

#m = patternsearch(inext_sibling)

k=0

for x in inext_sibling:

if x == '(':

f=k

if x == ')':

l=k

k=k+1

wsappend([inext_sibling,inext_siblingparentparentparentparentfind(attrs={'class':'icon-more-friend'})next_sibling,inext_sibling[:f],inext_sibling[f+1:l]])

print([inext_sibling,inext_siblingparentparentparentparentfind(attrs={'class':'icon-more-friend'})next_sibling,inext_sibling[:f],inext_sibling[f+1:l]])

wbsave(asksaveasfilename(defaultextension ='xlsx',filetypes = [('Excel 工作簿', 'xlsx')]))

可以啊。

在用Python编写批量任务、批量下载的项目中,当任务完成后需要输出任务结果,比如下载的文件数、任务名称等。一般情况下是在任务全部完成后一次性输出结果的,在此过程中会有很长一段时间没有信息输出,处于静默状态,以致于可能被认为程序没有正常运行,也无法得知当前执行到哪一步。

为了实时可视化显示任务的运行状态,Python中可以使用文本进度条来实现。文本进度条跟图形界面相比,以极低的资源消耗便可以实现类似的功能。

最近小弟在做一个应用程序,就是仿造360软件管家,获取计算机里已安装软件列表,

现思路如下,根据注册表路径

针对x86系统,HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Uninstall

针对x64系统,HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Microsoft\Windows\CurrentVersion\Uninstall

分别获取已安装软件列表,然后按照以下步骤进行处理:

1剔除service项,重复项,已安装补丁,如KB开头的子项(计划中,未能实现)

2合并x86,x64最终得到软件列表数据

Python QtWebEngine 是一个用于在 Python 中使用 QtWebEngine 模块的库。如果使用 Python QtWebEngine 编写的程序中,下载文件按钮不能使用,可能有以下几种原因:

1 没有设置下载路径:在默认情况下,QtWebEngine 下载的文件将保存在临时目录中,而不是用户指定的目录中。因此,您需要在程序中明确指定下载文件的保存路径。可以使用 QFileDialog 模块来打开一个对话框,以便用户选择下载文件的保存路径。

2 下载目录权限问题:如果您已经指定了下载文件的保存路径,但下载文件按钮仍然无法使用,可能是因为该目录没有写入权限。请确保您有权限在该目录下写入文件。

3 安全策略问题:在某些情况下,QtWebEngine 可能会限制文件下载,以保护用户的安全。例如,如果下载的文件来自不信任的网站或包含恶意代码,QtWebEngine 可能会阻止其下载。在这种情况下,您可以尝试使用其他下载方法,例如使用 urllib 或 requests 等 Python 模块进行下载。

综上所述,如果您的 Python QtWebEngine 程序中下载文件按钮无法使用,建议先检查您的程序是否明确指定了下载文件的保存路径,以及该目录是否具有写入权限。如果问题仍然存在,请考虑使用其他下载方法或查看 QtWebEngine 安全策略是否会阻止文件下载。

以上就是关于python爬虫获取有负载内容全部的内容,包括:python爬虫获取有负载内容、如何下载并安装python、Python request 响应状态等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9625533.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-30
下一篇2023-04-30

发表评论

登录后才能评论

评论列表(0条)

    保存