最近有朋友问我,他们的网站上线一个月了,但只被百度收录了首页,让我帮忙看看在SEO方面有什么问题。我粗略看了一下,就发现了好几个致命问题,比如robots.txt不规范、页面title重复度过高以及网页h1标签存在滥用,不经过SEO优化就上线的网站当然不会有好的收录和排名,那么一个网站上线前应该做哪些SEO工作呢?
新网站上线的第1个月,百度是会给予特别关照的,也就是说如果上线前做好了SEO优化并且在这一个月好好表现,百度是会给这个网站很好的展现机会的。对于上线前,除了网站BUG的检查之外,下面这些SEO注意事项一定要把好关。
1、网站服务器(砸钱)
服务器是网站的载体,服务器的稳定性影响着网站的打开体验,同样也影响着网站在搜索引擎蜘蛛前的表现。一个稳定快速的服务器是网站体验好的前提,这个钱一定不能舍不得花。
选择服务器,需要考虑的是服务器空间大小、服务器带宽,以及域名解析服务器(DNS服务器)的选择。服务器空间影响的是网页文件的存储和数据库的数据量,带宽越大则网站打开速度越快(前提是网页已经做过优化,不然一个BUG也会让极速的服务器慢如蜗牛),DNS服务器影响的是域名指向服务器网页的时间。一般情况下DNS服务器我们不用额外花费,使用空间商默认的就好;空间大小视网页文件量而定,不用提前买太大,后期随时可以升级扩容;宽带是越高越好但是也越贵,这个量力而行吧。
2、网站结构检查
网站上线前要对结构和URL进行检查,不能有死链,也最好不要有层次特别深的页面。搜索引擎喜欢扁平化的网站,所以尽量不要让文件夹层次超过三层,URL深度也尽量保证在三层以内,不然蜘蛛会找不到回家的路哦!(tips:三层文件夹指:wwwroot/a/b/index.html;三层链接深度指www.abc.com/a/b/index.html)
死链是绝对禁止的,尤其要保证首页不出现死链。
3、网页代码检查
这里面分两部分。一是关键词标签检查,另一部分是代码规范检查。
(1)关键词标签
影响SEO效果的关键词标签主要有:title标签、meta中的keywords和description标签,body中的h1、h2标签,以及链接a标签、加粗strong标签和图片说明alt属性。
最重要的则是页面标题title和页面H1两个标签了,每个网页只允许出现一次title和h1,并且title和h1要内容一致且全站唯一(tips:一个网站中不要有2个以上网页使用相同的title和h1)。title一定要包含关键词,这个会显示在搜索引擎结果页面。description要与页面主题保持一致并且包含页面关键词,也是有机会出现在搜索结果页面的,keywords可有可无,但不要乱写。
图片alt属性是用于给搜索引擎解释图片含义的,这里可以加关键词,但是也尽量和图片内容保持一致。
需要注意的是,任何位置的关键词都不要连续重复出现,堆砌关键词是有风险的,我们完全可以通过正规优化手段来达到我们想要的排名。
(2)代码规范检查
代码规范,一是要保证代码精练不冗余,再就是保证加载先后不冲突。前端多余的代码不要保留,注释代码能删就删,CSS要先载入,JS要尽量后置(一些特效或交互功能的JS除外)。
4、网站速度优化
第一步我们选择服务器的时候,就提过网站速度的问题。不过除了服务器硬件和带宽对网站速度的影响,还有这些也影响网站的打开速度。
(1)网站程序
我们的网站通常都是动态网站,用户看到的网页都是用程序动态生成的,程序运行的速度(时间复杂度)会影响网页生成的时间,从而对用户看到页面的时间也会产生影响,所以我们需要对程序运行速度优化。
通常情况下静态网页会比动态网页打开速度快,静态网页是用户访问前就生成的,比动态网页在用户访问量才生成少了一个过程。不过静态网页在修改时比较麻烦(需要覆盖原网页),而且占据服务器空间更多。
(2)网页元素体积和数量
用户输入域名找到服务器后,服务器会打开指定的网页同时根据网页的代码引用相关的元素(CSS、JS、图片、视频等)我们需要对这些内容进行合并或复用以减少请求次数。
(3)网站压缩
这个很简单,一般服务器都是支持一键开启网站GZIP压缩的,开启后可以大大减少网页的传输量,省流量的同时还可以提升打开速度。
5、URL优化
上面我们提到过URL深度不要超过三层,也提到了静态网页打开速度快。没错,搜索引擎更偏爱静态的URL,动态的URL因为带有太多的参数而让蜘蛛头昏脑胀。所以我们要尽量减少URL中的包含的参数并尽可能让搜索引擎认为是一个静态网页,如何做呢?URL伪静态。
URL伪静态是把动态的URL静态化,从而去掉URL中的"?"、"&"等符号,生成以.html或.shtml结尾或以文件夹结尾的URL结构,就像本网页一样(https://www.xiebit.com/16.html)
当然可能会有一些不方便进行URL伪静态的网站,也要一定保证URL唯一,不要多个URL对应同样的网页内容,会被判定为过多重复页面从而被降权的。必要的时候使用rel="canonical" 来规范页面的标准版本,该代码指向的网页将会被搜索引擎计算权重。
另外,如果网站同时有PC版和移动版,要在移动版中使用rel="canonical"指向其PC版本(URL适配),从而让移动版也获得PC版的权重。
6、网站内容
上线的时候,网站一定不能是空的。内容要事先填写一部分,同时要保证内容的原创度和时效性。首页和每个栏目页都要保证一定的内容量,并且每个网页的文字量不要太少。
7、网站地图
我们虽然强调内链通畅,但还是建议给网站生成一份网站地图放在根目录,方便向搜索引擎提交和被主动抓取。网站地图主要有三种:xml格式的、html格式的和txt格式的,推荐使用xml格式的地图文件。这个地图文件是要经常更新的,地图中的链接要和网页中的链接保持一致。
8、robots协议(蜘蛛文件)检查
robots.txt是蜘蛛发现网站域名后首先检查的文件,该文件可以声明网站中哪些页面允许被搜索引擎抓取,哪些不允许,同时可以指定搜索引擎。所以我们一定要把想被用户搜到的网页设成允许被抓取,即使用User-agent: * allow: /。同时建议把上一节提到的sitemap.xml网站地图文件引用进来:Sitemap: sitemap.xml(这里的地图文件要用地图的URL,即http://域名/sitemap.xml)
9、HTTP响应码(状态码)检查(上线当天)
前面说的所有步骤都是本机调试,这一步是上线后要查的,许多网站因为这里出问题而导致网站不被收录。HTTP响应码反应的是网页打开后的状态。我们需要注意的有这几个:200、301、302、404。HTTP5xx通常是程序问题或服务器问题,这个不在SEO的范围内,在此不谈。
HTTP200是网页正常打开,只要网站没问题就会是这个响应码。
HTTP301和302是网页重定向(跳转),301是永久重定向,是可以传递权重的;302是临时重定向,并不传递权重。所以我们在网站换域名,或网页换目录的时候都要用301重定向。而302重定向比较少用,通常是临时引流使用。这里需要提一点的是,搜索引擎是以URL为单位区分网页并计算权重的,而大多数网站都有一级域名和www开头的二级域名,所以同一个页面有着两个url,我们需要将两个URL权重合二为一,就需要使用301重定向功能,(前面提到的canonical也是这个意思,但不跳转)。
HTTP404是网页不存在,死链通常是这个提示。
这里容易出问题的有两个,301重定向和302重定向混用(可能是设置不当),这个影响不大,顶多就是不传权重;再就是404页面返回了200状态码,此种情况非常容易被K站。因为搜索引擎认为这个网页是正常的,但实际它是没内容的且千篇一律高度相似的,我们尽可能避免死链,但是也一定要让404页面返回404状态才行。
10、浏览器适配
为了让各种用户才能正常打开网页,我们有必要对多种浏览器(尤其是手机、微信浏览器)进行测试,看是否错位。这个虽然不是SEO的范畴但用户体验(访问深度、访问时长、回头客)也是对SEO有影响的,所以这一关也要把握好。
以上就是谢比特原创的网站上线前的SEO准备所有需要注意的了,虽然现在SEO的风口已过,但来自搜索引擎的免费流量还是很香的,为何不让自己的网站赢在起跑线上呢?