python爬虫中xpath怎么用？_随笔

python爬虫中xpath怎么用？

xpath一直都享有者python爬虫神器的美称，可以通过xpath定位一个或多个节点，这样的话，能够获取网页中的正文或者属性，甚至是获取全部所需要的各种信息，除此以外，它还是比较简洁清晰明了的路径选择表达式，好啦，根据上述所说，下面我们一起来掌握了解基本的xpath用法吧。

xpath 表达式：

//div[@class="document"]

属性：

Class

值：

document

实例应用——解析网站

from lxml import etree
text = """

    
        红楼梦
        活着
        百年孤独
        1984
    


"""
 
html = etree.HTML(text)
result = etree.tostring(html)
print(result.decode('utf-8'))

输出结果：

现在大家可以看到节点的变化了吧，自动添加了body、html 节点，好啦，感兴趣的小伙伴，可以根据上述内容，学习尝试下哦~

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/zaji/3013373.html

python爬虫中xpath怎么用？

发表评论

评论列表（0条）