使用phantomjs进行网页抓取,怎么获得div中的文本

使用phantomjs进行网页抓取,怎么获得div中的文本,第1张

如果要实现Taste算法,必备的条件是: 1) JDK,使用16版本。需要说明一下,因为要基于Eclipse构建,所以在设置path的值之前要先定义JAVA_HOME变量。 2) Maven,使用2011版本或以上。在eclipse上安装maven插件—m2eclipse

var nameValue = documentgetElementById("name")value;

var priceValue = documentgetElementById("price")value;

改为

var nameValue = documentgetElementById("name")innerHTML;

var priceValue = documentgetElementById("price")innerHTML;

就可以了。

你这段js放在哪的?如果在head里,dom都没有加载完,他就执行了,当然找不到相应的元素了。。。所以要写在加载事件之后。。。

windowonload = function() {

    var kkk = documentgetElementById('kkk'),

        qwe = documentgetElementById('qwe');

    if (kkkinnerText == "qqq") {

        kkkstyledisplay = "none";

    }

    if (qweinnerText == "qqq") {

        qwestyledisplay = "none";

    }

}

另外,一般会有个触发机制,上边这样写是能实现的,但是真正用的时候肯定不这么写

你可以用JQUERY获取,然后传递给asp文件处理

如:

<div

name='a'></div>

<div

name='b'></div>

$("div")eq(0)html()

获取的是第一个的HTML内容

$("div")eq(1)html()

获取的是第二个的HTML内容

也可以直接抓取

$("div[name='a']")html()

$("div[name='b']")html()

思路:通过id可以获取到<div>对象,通过getAttribute()和innerHTML分别可以获取<div>对象的自定义属性和文本内容。下面实例演示获取<div>标签的自定义属性user_id:

1、HTML结构

<div id="test" user_id="test_id">id="test" user_id="test_id"</div><br/>

<input type='button' value='获取div的自定义属性' onclick="fun()"/>

2、javascript代码

function fun(){

obj = documentgetElementById("test");

alert(objgetAttribute("user_id"))

}

3、点击按钮后效果

我看到一个错误的地方,那就是

newTex+=Texrea[i]value;

应该改成

newTex+=Texrea[i]innerHTML;

Textarea 这里不能使用 value

以上就是关于使用phantomjs进行网页抓取,怎么获得div中的文本全部的内容,包括:使用phantomjs进行网页抓取,怎么获得div中的文本、获取div里的文本内容,输出到表单、JS获取DIV或TD的内容进行判断并隐藏等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9401871.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-28
下一篇2023-04-28

发表评论

登录后才能评论

评论列表(0条)

    保存