谷歌Googlebot有 2 种抓取方式?google机器人抓取网页原理
谷歌Googlebot有 2 种抓取方式?google机器人抓取网页原理,好客站seo提供海外市场推广排名,搜索引擎技术研究分析,什么是 SEO 可抓取性?我们知道,良好的自然参考需要良好的完美技术参考。
如果您真的想充分利用您的网站并继续超越竞争对手,那么一些基本的SEO 技术知识是必须的。
在本文中,我们将看到技术 SEO 中最重要的概念之一:可抓取性。
又是什么爬虫?
像谷歌这样的搜索引擎由爬虫、索引和算法组成。爬虫跟随链接。当 Google爬虫找到您的网站时,它会读取它并将其内容保存在索引中。
爬虫跟踪网络上的链接。也称为机器人、机器人或蜘蛛。它每周 7 天、每天 24 小时在 Internet 上流通。每次它找到一个网站时,它都会将页面的 HTML 版本保存在一个巨大的数据库中,称为索引。
每次爬虫访问您的网站并找到新版本或修订版本时,该索引都会更新。根据您的网站对 Google 的重要性以及您对网站所做的更改,抓取工具的出现频率或多或少会有所不同。
了解更多seo技术支持可加微信18062443671,每天朋友圈分享seo技术知识 和行业案例。
在您的自然引用过程中考虑技术 SEO 的所有方面,特别是基本的 HTTPS,以确保您网站的一定程度的安全性。你可以在这里了解更多。
什么是可抓取性?google蜘蛛+google爬虫机器人
可抓取性是您的网站被 Google 机器人抓取的优势。机器人可能会在您的网站上被阻止。有几种方法可以阻止爬虫访问您的网站。
如果您的网站或网站上的某个页面被阻止,您就是在告诉 Google 抓取工具“不要来这里”。在大多数情况下,您的网站或相应页面不会出现在搜索结果中。
有几件事可能会阻止 Google 抓取(或编制索引)您的网站:
– 如果您的 robots.txt 文件阻止了爬虫,Google 将不会访问您的网站或特定网页。如网站出现异常收录等问题,可以联系海内外seo技术顾问微信/电话18062443671 。
在浏览您的网站之前,机器人会查看您页面的 HTTP 标头。此 HTTP 标头包含页面状态代码。如果此状态代码表明某个页面不存在,Google 将不会抓取您的网站。
如果特定页面上的元标记阻止搜索引擎将该页面编入索引,Google 将抓取该页面,但不会将其添加到其索引中。(无索引)
谷歌Googlebot有 2 种抓取方式?
Google在抓取网页时使用两种抓取方式:一种是发现新内容,另一种是刷新现有内容。
Googlebot 有 2 种抓取方式。 哪个 ?
Google 的网络趋势分析师 John Mueller在 1 月 7 日记录的 Google Search Central SEO 视频群聊中解释了这一点。一位 SEO专业人士加入直播,向 John Mueller 提出了一系列问题,其中一个问题涉及 Googlebot抓取他网站的频率。
他指出,当他更频繁地发布文章时,Googlebot 过去每天都会抓取他的网站,但当发布的文章较少时,它不会抓取那么多。
也许是因为害怕爬行频率的减少是一个不好的迹象,他问穆勒这是否正常。John Mueller 向他保证一切都很好,并继续解释了 Googlebot 从事的两种类型的抓取。
两种类型的 Googlebot 抓取
您可以通过Search Console中的报告了解 Googlebot 抓取您网站的频率,并且有时您的网站被抓取的次数可能比其他网站多。了解更多seo技术支持可加微信18062443671,每天朋友圈分享seo技术知识 和行业案例。
当被问及该报告时,John Mueller确认波动是正常的,并讨论了两种类型的爬行:
这有可能发生。与其说我们抓取一个网站,不如说我们抓取一个网站的各个页面。而说到爬行,我们大致有两种爬行。做国外seo优化找哪家公司靠谱?深圳好客站seo研究中心联系电话及微信18062773671
一种是发现爬虫,我们尝试在您的网站上发现新页面。
另一个是刷新爬虫,我们更新我们知道的现有页面。
不仅整个站点的抓取频率会有所不同,而且各个网页的抓取频率也会有所不同。
例如,如果您的主页比其他页面更新得更频繁,您会在该页面上看到更多的 Googlebot 活动。
约翰·穆勒继续说道:
所以在大多数情况下,例如,我们刷新主页,我不知道,一天一次,或者每两个小时,或者类似的东西。
如果我们在他们的主页上发现任何新链接,我们也会离开并探索那些发现爬虫的链接。正因为如此,在探索过程中,您总能看到发现和振奋的混合。
你会看到每天都在发生一些基地爬行。
但是,如果我们认识到单个页面很少更改,我们就会意识到我们不需要一直抓取它们。对于海内外seo优化公司可以咨询联系电话及微信18062443671 。
某些类型的网站可能比其他网站更容易被抓取。一天更新几次的新闻网站比一个月更新一次的网站被抓取的次数要多。
Googlebot 能够识别这些模式并相应地调整其抓取频率:
例如,如果您有一个新闻网站并且您每小时更新一次,我们应该知道我们需要每小时抓取一次。
而如果它是一个每月更新一次的新闻网站,我们应该知道我们不需要每小时抓取一次。
这不是质量的标志,也不是排名的标志,或者类似的东西。真的只是从纯技术的角度来看,我们了解到我们可以每天探索一次,或者每周探索一次,这没关系。
因此,如果您注意到 Googlebot 或多或少地访问您的网站,请不要担心。
此外,如果 Googlebot xxxxxx.com /tag/googlebot最近抓取了您的网站并且对现有内容的更新未反映在搜索结果中,请不要担心。
这可能是 Google 抓取您的网站以发现新内容而不是更新现有内容的情况。
如果您的网站很少更改已发布的内容,Googlebot 可能会进一步抓取以发现更新。
同样,这不一定与内容的质量有关。
Googlebot 我们一般称为Google 机器人或Google 探测器。Google “派遣”了不同的Googlebot 对网页内容进行获取。
Googlebot 有哪几种?主要包括:
1、Googlebot:抓取网页中的文字内容。获取的内容保存于Google 网页搜索和新闻搜索的数据库。我们一般谈的Google 机器人主要指这个。
2、Googlebot-Mobile:抓取网页中的文字内容,用于Google 手机搜索。
3、Googlebot-Image:抓取网页内的图片内容,保存入Google 图片搜索数据库。
4、Mediapartners-Google:抓取网页中的文字内容,用于Google Adsense 分析关键词。只有投放了Google Adsense 的网页才会被 Mediapartners-Google 探测器爬取。
5、Adsbot-Google:抓取网页中的文字内容,用于为Google AdWords 提供参考。只有Google AdWords 的目标网页才会被 Adsbot-Google 探测器爬取。
Googlebot 和Mediapartners-Google 是非常勤奋的机器人,如果他们影响到你服务器的承受力,你可以通过 robots.txt文件加以制止。了解更多seo技术支持可加微信18062443671。
外贸网络推广指南推荐
-
采用跨境电子商务市场策略的3个理由是什么?
2023跨境电商发展趋势分析报告-全球跨境电商最新资讯
2022跨境电商b2b还好做吗?如何做好b2b电商?
谷歌独立站SEO+电子商务产品页面的结构化数据标记
canonical SEO标签-在独立站SEO规范标签减少重复内容
Google独立站SEO 方法+谷歌SEO技术工具
什么是国际贸易?如何做好国际贸易?
东南亚在全球电子商务增长中名列前茅
海外市场非常需要哪些推广?SEO技术研究中心解答
海外推广媒体有哪些?海外推广平台有哪些?
Shopify SEO怎么做?Shopify搜索优化策略分析
Yoast 视频SEO是做什么的?Google独立站视频SEO排名
2022年独立站SEO优化6大问题-谷歌seo搜索优化
全球SEO的4种变化方式+全球搜索引擎特征分析
如何做国际搜索引擎优化顾问?
本页共有 0 条评论