网站日志可以获取哪些信息_沈阳SEO

网站日志可以获取哪些信息_沈阳SEO,第1张

一个seo工作人员,特别是那些大型网站的seo人员来说,能独立分析网站日志是一种必不可少的技能,因为大型的网站栏目结构以及页面非常的繁杂,蜘蛛也是少不了会频繁访问,从蜘蛛给网站留下的一些痕迹上面能够掌控网站不少的信息,这对网站优化运营是一种非常必要的参考,今天肥猫科技就跟大家讲讲我们能从网站日志中获取哪些信息。

一、哪些搜索引擎来了我的网站抓取

从网站日志里面可以看出网站被哪些蜘蛛所抓取,每个搜索引擎都有自己的蜘蛛程序,各大搜索引擎的标头特征如下所示:

百度蜘蛛:spider

谷歌蜘蛛:Googlebot

360蜘蛛:360Spider

搜狗蜘蛛:sogouspider

二、网站目录的抓取数量

通过抓取总量的分析可以对比出网站哪个目录更受搜索引擎的关注,一般来说蜘蛛抓取越频繁的目录,site网站此目录的排名会相对靠前,我们也可通过目录的蜘蛛访问量来适当调整目录的结构,对于那些抓取压力较大但是不怎么重要的目录也可适当缩减链接入口,以免阻碍给其它重要目录的抓取。

三、网站页面的抓取数量

可以从中看出哪个页面蜘蛛是否抓取了一些没有被收录价值的页面,或者老是重复的抓取了这些页面等,那么同理要先采取措施予以频闭,要么是运用到nofollow标签,要么是robots文件等,这样就会降低因为搜索引擎抓取到大量相关性低或者质量度差的页面而影响到页面的权重传递这样的不利影响。

四、可以一览蜘蛛方面各网页的状态码

五、了解网站日志蜘蛛的来访时间

对网站日常日志分析总结中,可以很直观的看出每天具体是哪个时间段是蜘蛛访问的高峰时期,我们为了迎合搜索引擎,也可以相应调整网站的更新时间,争取在蜘蛛活跃度最高的时间段更新文章,这样对自己网站的收录会有非常大的帮助,甚至还有可能达到秒收的效果!

肥猫科技认为,分析网站日志是一个非常有意义的技能,特别是网站建立的初期和运营遇到状况的时候,分析日志这个方面就更是尤为重要,当然再碰到信息量特别大的时候,手动 *** 作效果不好,可以使用一些日志分析工具来查看。

所谓304是指蜘蛛上次访问页面发出访问请求,当该页面未更新时,服务器端则返回404状态码。在网站日志中最喜欢看到的就是200状态码,当出现304状态码时许多人对会感到比较陌生,当返回过多304状态码时,容易导致网站快照不更新以及之后收录困难,要解决问题还得寻找源头,之后再一一排除解决,常见的网站出现304状态码的原因分析如下: 1、网站更新频率低于蜘蛛访问频率,导致蜘蛛对首页发出请求时,服务器端返回未更新状态码。 2、文章页未更新,文章页出现304状态码也不少见,不过一般文章收录后都较少做更改,此时我们可以在文章结尾添加更新带动器,如上下篇文章链接,相关文章推荐等,都能带动页面的更新

希望采纳

200是响应正常的意思,这个是服务器返回页面的响应头信息。里面的Transfer-Encoding: chunked,意思是使用了提前不可知数据长度的传输方式,需要浏览器继续读取响应,接下来才知道真实的数据长度。

网页返回状态码的含义详细介绍

1、 1xx(临时响应)用于表示临时响应并需要请求者执行 *** 作才能继续的状态代码。

(1)100(继续) 请求者应当继续提出请求。服务器返回此代码则意味着,服务器已收到了请求的第一部分,现正在等待接收其余部分。

(2)101(切换协议) 请求者已要求服务器切换协议,服务器已确认并准备进行切换。

2、 2xx(成功)用于表示服务器已成功处理了请求的状态代码。

(1)200(成功) 服务器已成功处理了请求。通常,这表示服务器提供了请求的网页。如果您的 robotstxt 文件显示为此状态,那么,这表示 Googlebot 已成功检索到该文件。

(2)201(已创建) 请求成功且服务器已创建了新的资源。

(3)202(已接受) 服务器已接受了请求,但尚未对其进行处理。

(4)203(非授权信息) 服务器已成功处理了请求,但返回了可能来自另一来源的信息。

(5)204(无内容) 服务器成功处理了请求,但未返回任何内容。

(6)205(重置内容) 服务器成功处理了请求,但未返回任何内容。与 204 响应不同,此响应要求请求者重置文档视图(例如清除表单内容以输入新内容)。

(7)206(部分内容) 服务器成功处理了部分 GET 请求。

3、 3xx(已重定向)要完成请求,您需要进一步进行 *** 作。通常,这些状态代码是永远重定向的。Google 建议您在每次请求时使用的重定向要少于 5 个。您可以使用网站管理员工具来查看 Googlebot 在抓取您已重定向的网页时是否会遇到问题。诊断下的抓取错误页中列出了 Googlebot 由于重定向错误而无法抓取的网址。

(1)300(多种选择) 服务器根据请求可执行多种 *** 作。服务器可根据请求者 (User agent) 来选择一项 *** 作,或提供 *** 作列表供请求者选择。

(2)301(永久移动) 请求的网页已被永久移动到新位置。服务器返回此响应(作为对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。您应使用此代码通知 Googlebot 某个网页或网站已被永久移动到新位置。

(3)302(临时移动) 服务器目前正从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。此代码与响应 GET 和 HEAD 请求的 301 代码类似,会自动将请求者转到不同的位置。但由于 Googlebot 会继续抓取原有位置并将其编入索引,因此您不应使用此代码来通知 Googlebot 某个页面或网站已被移动。

(4)303(查看其他位置) 当请求者应对不同的位置进行单独的 GET 请求以检索响应时,服务器会返回此代码。对于除 HEAD 请求之外的所有请求,服务器会自动转到其他位置。

(5)304(未修改) 自从上次请求后,请求的网页未被修改过。服务器返回此响应时,不会返回网页内容。

(6)305(使用代理) 请求者只能使用代理访问请求的网页。如果服务器返回此响应,那么,服务器还会指明请求者应当使用的代理。

(7)307(临时重定向) 服务器目前正从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。此代码与响应 GET 和 HEAD 请求的 301 代码类似,会自动将请求者转到不同的位置。但由于 Googlebot 会继续抓取原有位置并将其编入索引,因此您不应使用此代码来通知 Googlebot 某个页面或网站已被移动。

爱站SEO工具包之网站日志分析工具的使用方法。

1、此工具可以自动识别IIS、Apache、Nginx日志格式,支持直接拖拽日志一个或多个文件(夹)至窗口进行分析,每一项数据都分别以“数据显示”和“图形显示”两种不同方式向用户展示数据结果。

2、蜘蛛分析之(概要分析)即所有不同的蜘蛛的访问次数、停留时间、总抓取量的数据分析,(还可以单选不同蜘蛛)进行查询。

蜘蛛分析之(概要分析)图表显示,(还可以单选不同蜘蛛)进行查询显示。

3、蜘蛛分析之(目录抓取)即站点目录被抓取的数据量分析。

可以针对对某个目录或蜘蛛进行单独查询分析,且可切换至图表显示,显示抓取量饼图,轻松了解蜘蛛抓取目录概况。

4、蜘蛛分析之(页面抓取)

所有页面蜘蛛抓取量分析,还可以针对某个页面或某个蜘蛛进行单独查询分析。切换至图标显示,可以显示页面抓取量饼图,快速了解抓取量最多的页面,轻松分析页面抓取情况。

5、蜘蛛分析之(IP排行)

分析所有蜘蛛IP地址的访问次数、抓取量和停留时长,并可以针对某个ip或蜘蛛进行单独查询分析。

6、搜索引擎分析之(关键词分析)可分析出各搜索引擎来路的关键词。

7、状态码分析分为用户状态码和蜘蛛状态码。通过查看网站正常状态码和问题状态码,第一时间发现网站的问题页面,及时修改,改善用户体验和蜘蛛体验。

8、按时间统计,工具自动保存不同日期的日志文件数据,每一项统计功能都可以按照时间来分析,可有效查看时间段内的数据变化趋势。(还可以单选不同蜘蛛)进行查询显示。

以上就是爱站SEO工具包之网站日志分析工具的详细介绍。

以上就是关于网站日志可以获取哪些信息_沈阳SEO全部的内容,包括:网站日志可以获取哪些信息_沈阳SEO、网站出现304状态码是什么原因、网站返回状态码302如何解决等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/10634344.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-10
下一篇2023-05-10

发表评论

登录后才能评论

评论列表(0条)

    保存