robots.txt
一定要有,并且不能写错, 写错了后果很严重:-)
好的标题
对用户和搜索引擎都是好的体验。所以标题也一定要有,并且不能重复。
描述
是给搜索引擎看的,在用户通过搜索引擎搜索到你的网站时,会把描述当作摘要显示给用户。简洁清晰的描述有利于提高点击率(和排名没关系)。
理论上搜索引擎会自己计算摘要的,但是计算的效果并不总是那么完美。通过 meta 标签声明摘要可以把最想显示的内容呈现给搜索终端的用户。也有一些比较有意思的玩法,
比如用户搜索问题的时候,把最佳答案显示在摘要里,提高用户点击率。当然,这种做法是否有效需要自己测量统计了。
下面是设置的摘要在搜索结果的显示:
通过 meta 标签自定义关键词这种方式现在几乎对任何搜索引擎都没有效果了,可以看各个搜索引擎优化文档。所以这个标签几乎可以忽略。
sitemap
可以提高收录量。有了收录才能谈排名。一般爬虫抓取不会那么完全。通过自己提交 sitemap 可以让爬虫的更全面。Rails 里推荐用sitemap_generater直接生成,配置简单,生成快速,生成 10w 级别的链接只需几秒钟。
加在定时任务里,每天一次就 OK。
一些遗留 URL 如果不想流失权重,可以做 301 重定向。Rails 里这样:redirect_to xxx, :status => 301
nofollow
一般用来避免刷外链。用户发帖或回复里的链接都加上rel="nofollow"
,自己页面里的内链,比如帮助页面或者声明页面也可以加上,以免不重要的页面分权重。
例子:<a href="/pages/about_us" rel="nofollow">关于问答</a>
Google 的 webmaster 后台在对重复标题和重复页面通常会有优化建议。标题重复的原因很多,有一些是过滤条件和分页造成的。canonical
声明对于搜索引擎来说,相当于 301 重定向的作用。举个简单的例子:
http://ask.csdn.net/questions/703 和 http://ask.csdn.net/questions/703?sort=latest 是相同的内容,只是排序不同。对于搜索引擎来说会被收录两次,被认为是重复内容。加上<link rel="canonical" href="http://ask.csdn.net/questions/703">
之后这两个页面对于搜索引擎来说被认为是一个页面。
还有一种是消除重复 URL,可以自行观察 Quora 的这两个页面:https://www.quora.com/MySQL/questions
和 https://www.quora.com/MySQL
。
更详细的解释见 这里。
refs: