用于一个特殊HTML元素的PHP爬虫

用于一个特殊HTML元素的PHP爬虫,第1张

概述我们有这个简单的 HTML页面(用于测试!): <html><body><div class="my"> One </div><div class="my"> Two </div><div class="my"> Three </div><div class="other"> NO </div><div class="other2"> NO </div></body></html> 我们有这个简单的 HTML页面(用于测试!):

<HTML><body><div > One </div><div > Two </div><div > Three </div><div > NO </div><div > NO </div></body></HTML>

所以,我需要一个非常简单的PHP代码来抓取.
我想要被抓取的是,我希望:“one”,“two”,“three”成为一个PHP数组.我需要抓取所有进入“我的”类的东西.而且我不想拥有其他课程.

解决方法 试试这个你可以使用xpath来获得你的结果

$HTML = '<HTML>            <body>            <div > One </div>            <div > Two </div>            <div > Three </div>            <div > NO </div>            <div > NO </div>            </body>        </HTML>';$dom = new DOMdocument();$dom->loadHTML($HTML);$xpath = new DOMXPath($dom);$Tags = $xpath->query('//div[@]');foreach ($Tags as $tag) {    $node_value = trim($tag->nodeValue);    echo $node_value."<br/>";}
总结

以上是内存溢出为你收集整理的用于一个特殊HTML元素的PHP爬虫全部内容,希望文章能够帮你解决用于一个特殊HTML元素的PHP爬虫所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/1049474.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-05-25
下一篇2022-05-25

发表评论

登录后才能评论

评论列表(0条)

    保存