
edu SRC页面信息
提取信息
代码:
import requests from lxml import etree def src_tiqu(yeshu): for i in range(1,int(yeshu)): url='https://src.sjtu.edu.cn/List/?page='+str(i) print('提取->',str(i)+'页数') data=requests.get(url).content print(data.decode('utf-8')) soup = etree.HTML(data) result=soup.xpath('//td[@]/a/text()') results = '\n'.join(result) resultss = results.split() for edu in resultss: print(edu) with open(r'src_edu.txt', 'a+', enCoding='utf-8') as f: f.write(edu + '\n') f.close() if __name__ == '__main__': yeshu = input("提取的页数:") src_tiqu(yeshu) 总结 以上是内存溢出为你收集整理的python快速提取edu SRC页面检索信息全部内容,希望文章能够帮你解决python快速提取edu SRC页面检索信息所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)