当前位置 : 首页 » 文章分类 :  开发  »  Hexo博客(09)提交搜索引擎收录

Hexo博客(09)提交搜索引擎收录

为什么要提交搜索引擎收录?
我们的博客文章发布到网上后,要想被搜索引擎搜索到,首先要能够被搜索引擎的爬虫工具抓取到,而对于部署在Github Pages上的Hexo博客来说,由于Github主动屏蔽了来自于百度爬虫的请求,自然导致百度无法搜索到我们的文章。谷歌没这个问题,但谷歌国内用不了啊。
既然搜索引擎无法抓取我们的文章,那我们就主动提交给搜索引擎好了。


提交百度收录

网站验证

百度站长平台 注册并登陆,在站点管理中添加站点,这时会提示:

首先如果您的网站已使用了百度统计,您可以使用统计账号登录平台,或者绑定站长平台与百度统计账号,站长平台支持您批量导入百度统计中的站点,您不需要再对网站进行验证。

正好之前用此账号开通了我的博客的百度统计,直接导入百度统计站点。
百度站长平台为未使用百度统计的站点提供三种验证方式:文件验证、html标签验证、CNAME验证。

  1. 文件验证:您需要下载验证文件,将文件上传至您的服务器,放置于域名根目录下。
  2. html标签验证:将html标签添加至网站首页html代码的<head>标签与</head>标签之间。
  3. CNAME验证:您需要登录域名提供商或托管服务提供商的网站,添加新的DNS记录。

具体方法参见站长工具中的操作说明。

链接提交

前面说了,百度无法主动抓取我们部署在Github上的博客,只能选择自己将博客链接提交给百度。
如何选择链接提交方式?百度站长工具使用帮助已经说的很详细了:

  • 主动推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。
  • sitemap:您可以定期将网站链接放到Sitemap中,然后将Sitemap提交给百度。百度会周期性的抓取检查您提交的Sitemap,对其中的链接进行处理,但收录速度慢于主动推送。
  • 手工提交:如果您不想通过程序提交,那么可以采用此种方式,手动将链接提交给百度。

从效果和难易程度来综合考虑的话,使用js代码进行自动提交是最好最简单的方法。就像之前我们使用的各种第三方工具一样,比如多说评论、百度统计、CNZZ统计等,在ejs模版中加几行js代码就搞定。
至于加在哪个ejs模版中,道理想通了就很随意,只要保证每篇文章被打开的时候这些js代码能被加载执行就可以。所以可以加在article.ejs模版最后,这样每篇博客文章被打开时会去提交链接,如果想其他页面比如主页、类别、标签、关于页面也被搜索到,可以加在所有页面都会引用的局部模版中,比如footer.ejs中。

<script>
(function(){
    var bp = document.createElement('script');
    var curProtocol = window.location.protocol.split(':')[0];
    if (curProtocol === 'https'){
   bp.src = 'https://zz.bdstatic.com/linksubmit/push.js';
  }
  else{
  bp.src = 'http://push.zhanzhang.baidu.com/push.js';
  }
    var s = document.getElementsByTagName("script")[0];
    s.parentNode.insertBefore(bp, s);
})();
</script>

提交后未收录

加上自动推送代码后,在百度站长平台“链接提交”中能看到每天都有几个链接被提交,但百度site:搜索还是搜不到我的网站,搜文章页搜不到,tengj的文章中也说了,提交链接后不一定会被收录:

虽然说百度链接主动推送在收录速度上要优先于sitemap 和 网页提交,但是提交的内容是否收录还要取决你内容本身,如果你提交的网页内容质量较低,属于采集内容或者违规内容,那么这样的内容及时你使用主动推送提交也不一定能够百分百收录。
百度的主动推送只是给站长们提供一个能够更快让百度发现网页链接的接口,但是内容是否会被收录依然要经过百度数据库的对比检测以后,符合收录标准的内容才会被收录。


参考


上一篇 Hexo博客(10)部署并备份到Coding

下一篇 Linux-Shell脚本

阅读
1,300
阅读预计5分钟
创建日期 2016-08-22
修改日期 2016-08-22
类别
百度推荐