google关于优化网站的抓取与收录
发布:suifeng | 发布时间: 2011年3月17日很多关于网站结构、抓取与收录、甚至是排名的问题都可以被归结为一个中心问题,那就是:如何让搜索引擎尽快的抓取得你的网站。您还可以通过以下方式来帮助爬取工具来抓取和收录:
去除URL中的用户相关参数
那些不会对seo优化产生影响的URL中的参数——例如session ID或者排序参数——是可以从URL中去除的,并被cookie记录的。通过将这些信息加入cookie,然后301重定向至一个“干净”的URL,你可以保持原有的内容,并减少多个URL指向同一内容的情况。
控制无限空间你的网站上是否有一个日历表,上面的链接指向无数个过去和将来的日期(每一个链接地址都独一无二)?你的网页地址是否在加入一个&page=3563的参数之后,仍然可以返回200代码,哪怕根本没有这么多页。如果是这样的话,你的网站上就出现了所谓的“无限空间”,这种情况会浪费抓取机器人和你的网站的带宽。如何控制好“无限空间”,参考这里的一些技巧吧。
阻止Google爬虫抓取他们不能处理的页面
通过使用你的robots.txt 文件,你可以阻止你的登录页面,联系方式,购物车以及其他一些爬虫不能处理的页面被抓取。(爬虫是以他的吝啬和害羞而著名,所以一般他们不会自己 “往购物车里添加货物” 或者 “联系我们”)。通过这种方式,你可以让爬虫花费更多的时间抓取你的网站上他们能够处理的内容。
一个 URL, 一段内容
在理想的世界里,URL和内容之间有着一对一的对应:每一个URL会对应一段独特的内容,而每一段内容只能通过唯一的一个URL访问。越接近这样的理想状况,你的网站会越容易被抓取和收录。如果你的内容管理系统或者目前的网站建立让它实现起来比较困难,你可以尝试使用rel=canonical元素去设定你想用的URL去指示某个特定的内容。
发布:suifeng | 分类:谷歌SEO | 评论:1 | 引用:0 | 浏览:
| TrackBack引用地址
- 相关文章:
企业站如何做google优化 (2011-2-17 22:25:13)
影响google排名的50个seo因素 (2011-1-20 16:41:20)
- 1.瑞士军刀包
- http://www.wuguomao.com
- 学习了。。。以后赚大钱就全靠它了。
- 2012/1/14 4:11:11 回复该留言
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。





