神马搜索引擎Spider蜘蛛介绍
神马搜索引擎Spider蜘蛛介绍
1. 神马Spider
神马搜索引擎Spider蜘蛛是神马访问互联网,自动化抓取网页的程序。Spider抓取下网页,建立索引,使用户可通过搜索引擎搜索到互联网上的资源。
2. 神马Spider的user-agent及ip地址
user-agent,是http协议中的一个属性,代表了终端的身份。神马Spider的user-agent为:Yisouspider,因为历史原因此user-agent名称将会继续使用。
神马Spider的ip地址是一组ip池,会动态变,因此不在此列举。
3. 神马Spider的网站访问频率
神马会根据网站的规模、服务能力、页面质量、更新速度等因素来决定对网站的访问频率。通常质量高、网页更新快的网站神马spider访问的频率相对会高,以保证高质、时效的能够展现给用户。
4. 神马spider如何发现新网页
神马spider发现新网页的方式有多种,最典型的是在已发现的网页中分析超链关系,选取url并抓取,如此不断拓展,尽可能多的抓取到有价值的网页。另外,神马会从dns服务商处获取新网站域名,能够及时抓取到新建网站。
5. 关于robots协议
robots.txt是搜索引擎访问网站是要访问的第一个文件,以确定哪些网页是允许或禁止抓取的。神马搜索遵守互联网robots协议,如您希望完全禁止神马访问或对部分目录禁止访问,您可以通过robots.txt文件来设置内容,限定神马Spider的访问权限。
robots.txt必须放在网站根目录下,且文件名要小写。
具体的写法:
1) 完全禁止神马Spider抓取:
User-agent: Yisouspider
Disallow: /
2) 禁止神马spider抓取指定目录
User-agent: Yisouspider
Disallow: /update
Disallow: /history
禁止抓取update、history目录下网页
6. 神马Spider是否会造成带宽负担
神马搜索引擎Spider蜘蛛有规范的抓取流程,同时也会考虑网站的忙闲时段来抓取,因此不会给网站造成带宽负担。
本页共有 2 条评论
SEO优化技术指南推荐
-
2021年SEO的机遇有哪些?-搜索引擎公司排行榜
2021-2022年SEO行业发展前景几大趋势+SEO对行业冲击
国内搜索引擎排行榜+市场推广渠道汇总
SEO面试题-个人站长搜索引擎热门话题-seo零经验面试
2021年做SEO优化还有市场吗-搜索引擎优化现状如何
seo+竞争对手分析+策划书
SEO效果不稳定问题-如何解决排名波动大
百度SEO排名算法规则简要+SEO工作人员
SEO排名/SEM那点事儿+如何做好一个SEO技术人
在SEO行业,最乱的是什么?-SEO假象解密
网站标题做改动后多久能缓过来+提升权重分析
WordPress SEO优化技术之robots设置及固定链接优化
seo面试常见问题及答案纠正解读技巧范文+SEO推广
搜索引擎优化与伪静态页面处理技术
电商淘宝网站SEO优化推广与淘宝直通车的区别
AnWen
1. 神马Spider
神马Spider是神马访问互联网,自动化抓取网页的程序。Spider抓取下网页,建立索引,使用户可通过搜索引擎搜索到互联网上的资源。
2. 神马Spider的user-agent及ip地址
user-agent,是http协议中的一个属性,代表了终端的身份。神马Spider的user-agent为:Yisouspider,因为历史原因此user-agent名称将会继续使用。
神马Spider的ip地址是一组ip池,会动态变,因此不在此列举。
AnWen
神马是全球第一款完全基于移动互联网的搜索引擎。神马为移动而生,专注于移动搜索用户刚需满足和痛点解决,致力于创造有用、有趣的全新移动搜索体验。