不用web框架,怎么通过python获取网页表单提交的数据,并传入数据库啊,求大佬们帮帮忙

不用web框架,怎么通过python获取网页表单提交的数据,并传入数据库啊,求大佬们帮帮忙,第1张

你想自己实现 wsgi 还是使用 wigiref 模块?你需要了解wsgi 基础,所有表单数据 可以通过 wsgi 的入口函数中的参数 envrion['wsgi.input'] 获取到

wsgi参考资料:

https://www.python.org/dev/peps/pep-3333/

https://pep-3333-wsgi.readthedocs.io/en/latest/

我们在一些没有反爬虫机制的生物网站上,可以利用Python做一些“省力”的事情,比方说ID的转换

我们以uniprot为例,进入它的转换页面 传送门 ,页面:

这里介绍下 urllib 这个Python库,该库功能非常强大,可以爬取动态网页

根据这个思路,我们看看该网站的网页结构:

url 为ID转换的网址,params是你要爬取的内容,存储为字典形式,那么字典的键值代表HTML表单(form)里面 name 的内容:

比方说 from:

字典的键值与form的name标签的内容对应

to也是一样的:

至于 "format": "tab" 是指我们把爬下来的网页转换为 tab 格式

当然,这招适用于表单提交的爬虫,如果爬取的内容过多,不妨写个函数:

参考: 传送门


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/sjk/9416272.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-28
下一篇2023-04-28

发表评论

登录后才能评论

评论列表(0条)

    保存