乐趣区

基于Vue-SEO的四种方案

前言:众所周知,Vue SPA 单页面应用对 SEO 不友好,当然也有相应的解决方案,下面列出几种最近研究和使用过的 SEO 方案,SRR 和静态化基于 Nuxt 来说。

  • 1.SSR 服务器渲染;
  • 2. 静态化;
  • 3. 预渲染 prerender-spa-plugin;
  • 4. 使用 Phantomjs 针对爬虫做处理。

1.SSR 服务器渲染

关于服务器渲染:Vue 官网介绍,对 Vue 版本有要求,对服务器也有一定要求,需要支持 nodejs 环境。

使用 SSR 权衡之处:

  • 开发条件所限,浏览器特定的代码,只能在某些生命周期钩子函数 (lifecycle hook) 中使用;一些外部扩展库 (external library) 可能需要特殊处理,才能在服务器渲染应用程序中运行;
  • 环境和部署要求更高,需要 Node.js server 运行环境;
  • 高流量的情况下,请准备相应的服务器负载,并明智地采用缓存策略。

优势:

  • 更好的 SEO,由于搜索引擎爬虫抓取工具可以直接查看完全渲染的页面;
  • 更快的内容到达时间 (time-to-content),特别是对于缓慢的网络情况或运行缓慢的设备。

不足:(开发中遇到的坑)
1. 一套代码两套执行环境,会引起各种问题,比如服务端没有 window、document 对象,处理方式是增加判断,如果是客户端才执行:

if(process.browser){console.log(window);
}

引用 npm 包,带有 dom 操作的,例如:wowjs,不能用 import 的方式,改用:

if (process.browser) {var { WOW} = require('wowjs');
     require('wowjs/css/libs/animate.css');
 }

2.Nuxt asyncData 方法,初始化页面前先得到数据,但仅限于 页面组件 调用:

// 并发加载多个接口:async asyncData ({app, query}) {let [resA, resB, resC] = await Promise.all([app.$axios.get('/api/a'),
      app.$axios.get('/api/b'),
      app.$axios.get('/api/c'),
     ])
     
     return {
       dataA: resA.data,
       dataB: resB.data,
       dataC: resC.data,
     }
  }

在 asyncData 中获取参数:

1. 获取动态路由参数,如:/list/:id'==>'/list/123

接收:async asyncData ({app, query}) {console.log(app.context.params.id) //123
}
2. 获取 url? 获取参数,如:/list?id=123

接收:async asyncData ({app, query}) {console.log(query.id) //123
}

3. 如果你使用 v-if 语法,部署到线上大概也会遇到这个错误:

Error while initializing app DOMException: Failed to execute 'appendChild' on 'Node': This node type does not support this method.
    at Object.We [as appendChild]

根据 github nuxt 上的 issue 第 1552 条提示,要将 v-if 改为 v-show 语法。

4. 坑太多,留坑,晚点更。

2. 静态化

在 Nuxt.js 执行 generate 静态化打包时,动态路由会被忽略。

-| pages/
---| index.vue
---| users/
-----| _id.vue

需要动态路由先生成静态页面,你需要指定动态路由参数的值,并配置到 routes 数组中去。

// nuxt.config.js
module.exports = {
  generate: {
    routes: [
      '/users/1',
      '/users/2',
      '/users/3'
    ]
  }
}

运行打包,即可看见打包出来的页面。
但是如果路由动态参数的值是动态的而不是固定的,应该怎么做呢?

  • 使用一个返回 Promise 对象类型 的 函数;
  • 使用一个回调是 callback(err, params) 的 函数。
// nuxt.config.js
import axios from 'axios'

export default {
  generate: {routes: function () {return axios.get('https://my-api/users')
      .then((res) => {return res.data.map((user) => {
          return {
            route: '/users/' + user.id,
            payload: user
          }
        })
      })
    }
  }
}

现在我们可以从 /users/_id.vue 访问的payload,如下所示:

async asyncData ({params, error, payload}) {if (payload) return {user: payload}
  else return {user: await backend.fetchUser(params.id) }
}

如果你的动态路由的参数很多,例如商品详情,可能高达几千几万个。需要一个接口返回所有 id,然后打包时遍历 id,打包到本地,如果某个商品修改了或者下架了,又要重新打包,数量多的情况下打包也是非常慢的,非常不现实。
优势:

  • 纯静态文件,访问速度超快;
  • 对比 SSR,不涉及到服务器负载方面问题;
  • 静态网页不宜遭到黑客攻击,安全性更高。

不足:

  • 如果动态路由参数多的话不适用。

3. 预渲染 prerender-spa-plugin

如果你只是用来改善少数营销页面(例如 /, /about, /contact 等)的 SEO,那么你可能需要预渲染。无需使用 web 服务器实时动态编译 HTML,而是使用预渲染方式,在构建时 (build time) 简单地生成针对特定路由的静态 HTML 文件。优点是设置预渲染更简单,并可以将你的前端作为一个完全静态的站点。

$ cnpm install prerender-spa-plugin --save

vue cli 3 vue.config.js配置:

const PrerenderSPAPlugin = require('prerender-spa-plugin');
const Renderer = PrerenderSPAPlugin.PuppeteerRenderer;
const path = require('path');
module.exports = {
    configureWebpack: config => {if (process.env.NODE_ENV !== 'production') return;
        return {
            plugins: [
                new PrerenderSPAPlugin({
                    // 生成文件的路径,也可以与 webpakc 打包的一致。// 下面这句话非常重要!!!// 这个目录只能有一级,如果目录层次大于一级,在生成的时候不会有任何错误提示,在预渲染的时候只会卡着不动。staticDir: path.join(__dirname,'dist'),
                    // 对应自己的路由文件,比如 a 有参数,就需要写成 /a/param1。routes: ['/', '/product','/about'],
                    // 这个很重要,如果没有配置这段,也不会进行预编译
                    renderer: new Renderer({
                        inject: {foo: 'bar'},
                        headless: false,
                        // 在 main.js 中 document.dispatchEvent(new Event('render-event')),两者的事件名称要对应上。renderAfterDocumentEvent: 'render-event'
                    })
                }),
            ],
        };
    }
}

在 main.js 中添加:

new Vue({
  router,
  render: h => h(App),
  mounted () {document.dispatchEvent(new Event('render-event'))
  }
}).$mount('#app')

注意:router 中必须设置 mode:“history”

打包出来可以看见文件,打包出文件夹/index.html,例如:about => about/index.html,里面有 html 内容。

优势:

  • 改动小,引入个插件就完事;

不足:

  • 无法使用动态路由;
  • 只适用少量页面的项目,页面多达几百个的情况下,打包会很很很慢;

4. 使用 Phantomjs 针对爬虫做处理

Phantomjs 是一个基于 webkit 内核的无头浏览器,即没有 UI 界面,即它就是一个浏览器,只是其内的点击、翻页等人为相关操作需要程序设计实现。
虽然“PhantomJS 宣布终止开发”,但是已经满足对 Vue 的 SEO 处理。
这种解决方案其实是一种旁路机制,原理就是通过 Nginx 配置,判断访问的来源 UA 是否是爬虫访问,如果是则将搜索引擎的爬虫请求转发到一个 node server,再通过 PhantomJS 来解析完整的 HTML,返回给爬虫。

具体代码戳这里:vue-seo-phantomjs。
要安装全局phantomjs,局部express,测试:

$ phantomjs spider.js 'https://www.baidu.com'

如果见到在命令行里出现了一推 html,那恭喜你,你已经征服 PhantomJS 啦。
启动之后或者用 postman 在请求头增加 User-Agent 值为Baiduspider,效果一样的。

部署上线
线上要安装nodepm2phantomjs,nginx 相关配置:

upstream spider_server {server localhost:3000;}

server {
    listen       80;
    server_name  example.com;
    
    location / {
      proxy_set_header  Host            $host:$proxy_port;
      proxy_set_header  X-Real-IP       $remote_addr;
      proxy_set_header  X-Forwarded-For $proxy_add_x_forwarded_for;

      if ($http_user_agent ~* "Baiduspider|twitterbot|facebookexternalhit|rogerbot|linkedinbot|embedly|quora link preview|showyoubot|outbrain|pinterest|slackbot|vkShare|W3C_Validator|bingbot|Sosospider|Sogou Pic Spider|Googlebot|360Spider") {proxy_pass  http://spider_server;}
    }
}

优势:

  • 完全不用改动项目代码,按原本的 SPA 开发即可,对比开发 SSR 成本小不要太多;
  • 对已用 SPA 开发完成的项目,这是不二之选。

不足:

  • 部署需要 node 服务器支持;
  • 爬虫访问比网页访问要慢一些,因为定时要定时资源加载完成才返回给爬虫;
  • 如果被恶意模拟百度爬虫大量循环爬取,会造成服务器负载方面问题,解决方法是判断访问的 IP,是否是百度官方爬虫的 IP。

总结

如果构建大型网站,如商城类,别犹豫,直接上 SSR 服务器渲染,当然也有相应的坑等你,社区较成熟,英文好点,一切问题都迎刃而解。
如果只是个人博客、公司官网这类,其余三种都可以。
如果对已用 SPA 开发完成的项目进行 SEO 优化,而且支持 node 服务器,请使用Phantomjs

很少写文章,这是我这个月对 Vue SEO 方案的探索,写的不对的地方请指出,谢谢理解~

退出移动版