NodeJs生成sitemap站点地图

39次阅读

共计 1562 个字符,预计需要花费 4 分钟才能阅读完成。

如果博客是使用 Hexo 管理的,sitemap 可以使用插件来生成。但对于一个内容管理网站,后端可能是 express、koa 之类的框架,这时 sitemap 就需要自己来生成了

什么是 sitemap

  Sitemap 可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的 Sitemap 形式,就是 XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。

sitemap 结构

<url>
    <loc>http://www.jouypub.com/</loc>
    <lastmod>2019-05-01</lastmod>
    <changefreq>daily</changefreq>
    <priority>0.5</priority>
</url>

loc:文章链接地址
lastmod:最后更新时间
changefreq:更新频率,daily/monthly
priority:权重

生成 sitemap,基于 express 项目

开源包:sitemap,地址: https://github.com/ekalinin/s…

> npm install --save sitemap

代码中使用

const express = require('express')
const sm = require('sitemap');

router.get('/sitemap.xml', function (req, res) {let pageRequest = Object.create({});
    pageRequest.pageSize = -1;
    pageRequest.pageNum = 1;
    api.post('/article/list', pageRequest, function (result) {let urls = [];
        for (let article in  result) {
            urls.push({
                url: article.url,
                changefreq: 'daily',
                lastmodrealtime: true,
                priority: 1,
                lastmod: article.updateTime
            });
        }

        let sitemap = sm.createSitemap({
            hostname: 'http://invest.jouypub.com',
            cacheTime: 600000,  // 600sec, cache purge period
            urls: urls
        });

        sitemap.toXML(function (err, xml) {if (err) {console.log(err);
                return res.status(500).end();}
            res.header('Content-Type', 'application/xml');
            res.send(xml);
        });
    });
});

sitemap 优化

上面那种方法在文章数少时还能使用,如果有几千甚至几万篇文章,一次拉取的方式就不适合了,就需要把返回结果写入到文件中,一天更新一次。只需要只需要把
sitemap.toXML()
改成
fs.writeFileSync("app/assets/sitemap.xml", sitemap.toString()); 即可。每次请求 sitemap 时读文件即可


欢迎订阅「K 叔区块链」– 专注于区块链技术学习

博客地址:http://www.jouypub.com
简书主页:https://www.jianshu.com/u/756c9c8ae984
segmentfault 主页:https://segmentfault.com/blog/jouypub
腾讯云主页:https://cloud.tencent.com/developer/column/72548

正文完
 0