背景
这是一个全栈项目,后端使用 node
。项目需要提供 B 端与 C 端两个版本:
- B 端要求支持多实例环境
- C 端要求跨平台离线独立运行
项目中一些复杂的数据处理功能由 C 语言
编译而成的 动态链接库(DLL)
(在 Linux 下叫做 Shared Library
,简称 SO
,以下统称 DLL
),及 python
封装的接口以 http
形式提供服务。在 C 端版本中,由于需要满足离线独立运行的需求,python
服务被打包成 可执行程序
,node
通过执行命令行方式调用。
根据以上要求,我们做了以下技术选型。
技术选型
-
node
版本选用了当时的 LTS 版本
10.15.3
,但由于后来为了和 Electron 中内置的 node 版本保持统一,修改为了10.11.0
。虽然 10.15.3 与 10.11.0 感觉版本相差不多,但确实有一些特性不同。例如
fs.mkdir
,10.15.3 支持recursive
选项,但 10.11.0 不支持,导致迁移到 Electron 时,运行结果不符预期。因此如果同时要开发 B 端与 C 端,为了更方便迁移,最好一开始便确定好 node 的具体版本。 - 数据库
由于需要支持 C 端
离线独立运行
的需求,数据库选用了sqlite
。sqlite
是单文件数据库,npm 包sqlite3
,是对 sqlite3 引擎的一层封装。一个数据库文件、一个包含数据库引擎的 npm 包,使得 C 端打包成离线独立运行程序成为可能。 -
DLL
的载入与调用在
node
中,DLL 的调用,主要借助以下两个 npm 包:-
ffi
: 实现node
加载并调用 DLL -
ref
: 提供强大的内存指针操作
-
-
C 端应用构建与打包
Electron
是由 Github 开发,用 HTML,CSS 和 JavaScript 来构建跨平台桌面应用程序的一个开源库。Electron 通过将 Chromium 和 Node.js 合并到同一个运行时环境中,并将其打包为 Mac,Windows 和 Linux 系统下的应用来实现这一目的。Electron 对前端开发者的友好,及对跨平台的支持,使得我们决定使用 Electron 来对 B 端版本进行一次包装,最大程度复用 B 端代码。主要用到了这几个依赖:
-
electron@4.2.0
:4.x
版本的 electron 内置的 node 版本是10.x
,可以与 B 端所用 node 版本匹配 -
electron-builder
: 用于 electron 打包
-
开发环境搭建及问题排查
- 依据
DLL
的位数
确定开发环境DLL
的位数
对开发环境搭建有很大的影响。以本项目为例,某 DLL windows 平台上只提供了 32 位版本,导致我们在开发时,必须选用 32 位 node。万幸的是,不需要系统也为 32 位。此处推荐使用
nvm
对 node 版本进行管理,当切换了 node 版本后,类似于ffi
ref
sqlite3
node-sass
这样的原生模块都需要重装,借助node-gyp
或同类工具进行重新编译。参考:native module on node.js
-
安装
ref
ffi
sqlite3
等原生模块依赖时,需要借助node-gyp
来针对当前系统平台进行编译。因此node-gyp
的安装前置条件必须满足参考:github: node-gyp#Installation
以下为本项目中实践步骤
-
Linux
- 安装
python v2.7
- 安装
make
-
安装
gcc
gcc-c++
- gcc 版本需要与使用的 DLL 依赖的 gcc 版本保持一致,gcc-c++ 需要与 gcc 版本保持一致
- 安装
-
Windows
-
npm install --global --production windows-build-tools
-
windows-build-tools
能够帮助我们方便地配置好编译 node 原生模块需要的环境 - 本项目中还使用了参数
--vs2015
,默认情况安装的是 VS2017,一开始遇到了一些问题,后来换成 VS2015 过程要顺畅一些,这个选项可看情况选择
-
-
npm config set msvs_version 2015
,如果安装的是 VS2017,则值设置为2017
npm config set python python2.7 的安装路径
-
-
-
Electron 开发环境
Electron 开发环境与第 2 点要求一致,不同的是,我们使用的
node
是 Electron 内置的 node,而非系统安装的 node。因此需要为 Electron 环境重新编译 node 原生模块。这一步可以借助 npm 包
electron-rebuild
或electron-builder
完成- electron-rebuild 方式:Electron 文档:使用 Node 原生模块
- electron-builder 方式:electron-builder:Quick Setup Guide
本项目使用的是第二种方式:
- 安装依赖
electron-builder
- 添加
"postinstall": "electron-builder install-app-deps"
到 npm scripts 中,这样每次安装依赖时,将会自动为我们进行原生模块编译
Electron 版本选择扩展资料:
- Electron 打包 Node 程序:NODE_MODULE_VERSION 值不一致引发的问题。(1)
- Electron 打包 Node 程序:怎么获取 electron、node 的 abi 以及指导 abi 获取版本(2)
- node – NODE_MODULE_VERSION(ABI) 版本对照表
-
安装依赖(其中一些问题也可能出现在 Electron 打包中)
npm install
- 依赖建议使用 npm 而不是 cnpm 进行安装,参考
- linux 环境安装时,如果当前用户为
root
,则需要添加参数--unsafe-perm
,否则会遇到EACCES: permission denied
等权限不足错误 - 若遇到 v140 相关报错,需安装
v140 工具集
,可用的一个方法:通过 Visual Studio 安装 -
若
MSBuild
时报错信息出现了Microsoft.Cpp.Default.props
相关信息,且发现寻找的地址并不正确可尝试设置环境变量:
set VCTargetsPath=C:\Program Files(x86)\MSBuild\Microsoft.Cpp\v4.0\V140
该路径一般是这样的,但也有可能有所不同,根据实际情况设置
参考:StackOverflow:Why does MSBuild look in C: for Microsoft.Cpp.Default.props instead of c:Program Files (x86)MSBuild? (error MSB4019)
- rcedit.exe failed – unable to commit changes
DLL
的使用
相比起环境配置,DLL
的使用要更简单。ffi
结合 ref
,基本使用可参考 ffi 官方示例 ref 官方示例。
常见问题
-
DLL 依赖于其他 DLL
这个问题比较常见,我们尝试过两种方案
-
使用
ffi.DynamicLibrary
引入依赖let {RTLD_NOW, RTLD_GLOBAL} = ffi.DynamicLibrary.FLAGS; // 有多个则执行多次 ffi.DynamicLibrary 来引入多个 ffi.DynamicLibrary( '/path/to/.dll/or/.so', RTLD_NOW | RTLD_GLOBAL );
- 使依赖可全局访问,详情见下文
-
- 遇到错误码为
126
的 win error这个表示无法找到 DLL,可能是路径错误,也可能是其依赖未引入或无法被程序在全局路径访问。开发与部署环境有差异时,很容易遇到这种问题。
那么我们可以怎样确定缺少的依赖是哪一个呢?Linux 提供了
ldd
支持我们查看程序运行所需的 DLL,若无法找到某个依赖,其对应的地址将为not found
。Windows 自带的 CMD 不支持该命令,但 Git Bash 等工具为我们集成了该功能。另外 Windows 下也可以使用Dependency Walker
等工具获取依赖。 - 想合并多个库到一个对象上
ffi.Library
第三个参数支持传入一个对象,若传入这个对象,ffi 会将该库新增的方法添加到这个对象上,同名将被覆盖,最终返回这个对象,没有传这个参数时,会返回一个新的对象。可以这样做,但一般来说没有这种需求。 -
使用
ffi
读取复杂数据结构举一个简单的例子——读取字符串数组
function readStringArray (buffer, total) {let arr = []; for (let i = 0; i < total; i++) {arr.push(ref.get(buffer, ref.sizeof.pointer * i, ref.types.CString)); } return arr; }
参考:Complex data structures with node-ffi
使 DLL 或其依赖可全局访问
Windows 环境
- 共享目录方式
Win 32 | Win 64 | |
---|---|---|
32-bit DLL | C:/Windows/System32 | C:/Windows/SysWOW64 |
64-bit DLL | C:/Windows/System32 |
根据 DLL 位数及操作系统位数的不同,将 DLL 放到以上某个目录即可
-
环境变量 PATH
众所周知,Windows 下 PATH 环境变量非常神奇,DLL 也不例外。将 DLL 所在目录的绝对路径加到 PATH 环境变量中,可以实现 DLL 全局访问。放在 node 里面,可以通过如下方式动态设置:
process.env.PATH += `${path.delimiter}${xxx}`;
Linux 环境
主要是通过命令 ldconfig
。ldconfig
是一个 SO 管理命令,可以使 SO 为系统所共享。ldconfig
按照一定规则搜寻 SO 并创建链接、缓存,供程序使用。
以下为搜寻范围:
-
/lib
目录 -
/usr/lib
目录 -
/etc/ld.so.conf
文件中声明的目录 -
通常情况下,
/etc/ld.so.conf
文件中会有一行如下内容:include ld.so.conf.d/*.conf
因此,目录
/etc/ld.so.conf.d
里以.conf
结尾的文件中声明的目录也在搜寻范围 - 全局变量
LD_LIBRARY_PATH
中设置的目录
因此,将 SO 放置到如上所说的目录中,并执行 ldconfig
即可实现 SO 共享。我们可以修改 /etc/ld.so.conf
文件、新增 /etc/ld.so.conf.d/*.conf
文件或修改全局变量 LD_LIBRARY_PATH
。
参考:
- Linux Programmer’s Manual-LDCONFIG(8)
- 【Linux 笔记】ldconfig、ldd
- Difference between lib, lib32, lib64, libx32, and libexec
一个 Linux 开机脚本配合 ldconfig 应用实践
项目中文件解析部分依赖了许多 DLL,其中有部分对图形界面产生了影响,导致用户再次登录时显示黑屏。
文件解析的 DLL 依赖是通过 node 在程序启动时写了一个文件到 /etc/ld.so.conf.d
下,里面声明了依赖所在路径,linux 开机时会自动加载。而解决黑屏则需要在开机时,自动去除该依赖声明,避免用户无法进入系统桌面。
因此此处需要用到开机脚本在开机时为我们做一些处理,示例如下:
新建文件 delete-ldconfig.sh
内容如下:
#!/bin/bash
# chkconfig: 5 90 10
# description: test
rm -f /etc/ld.so.conf.d/test.conf
ldconfig
执行如下命令:
cp ./delete-ldconfig.sh /etc/rc.d/init.d
cd /etc/rc.d/init.d/
chmod +x delete-ldconfig.sh
chkconfig --add delete-ldconfig.sh
chkconfig delete-ldconfig.sh on
参考:
- 【centos7】添加开机启动服务 / 脚本
- CentOS 统的 7 个运行级别的含义
Electron 主进程繁忙阻塞渲染进程问题
C 端进行文件解析测试时,使用了一个 node_modules 目录打包而成的压缩包,体积虽然不算很大,但小文件十分多。调用 DLL 解析时,大致耗时 30 分钟,后续程序处理又花了较久时间。在此期间,C 端应用界面失去响应。
经过查询,原来在 chromium 中,页面渲染时,UI 进程需要和 main process 不断的进行 sync IPC,若此时 main process 忙,则 UI process 就会在 IPC 时阻塞。
所以,不希望渲染进程被阻塞,就需要为主进程减负。如
- 在大量同步代码中间断地插入异步处理,将执行权暂时交出
- 使用多进程
参考:Electron 的主进程阻塞导致 UI 卡顿的问题
中断同步代码
在一开始的实现中,文件解析后的结果处理是使用一个 for 循环,无任何异步操作,是一个 CPU 密集型的任务。
使用以下代码模拟该场景:
(async () => {setInterval(() => {console.log('=====');
}, 60);
while (true) {// 一些处理}
})();
为了解决这块的阻塞问题,我们可以进行如下改造:
(async () => {setInterval(() => {console.log('=====');
}, 60);
while (true) {
await new Promise(resolve => {setImmediate(() => {
// 一些处理
resolve();});
});
}
})();
使用多进程
在 Electron 中实现多进程有很多选择,如 Web Workers、Node 的 child_process 模块、cluster 模块、worker_threads 模块等。
由于 Electron 项目安装的原生模块是经过重新编译的,且应用运行时,会出现环境变量上的差异,导致某些系统程序无法找到。因此,我们不能直接用 child_process.exec
等类似方式来启动我们子进程。
此次实践中,我们经过多种尝试,最终决定采用如下方式:
// 主进程
const bkWorker = child_process.spawn(process.execPath /* 1 */, ['./app.js'], {stdio: [0, 1, 2, 'ipc'], /* 2 */
cwd: __dirname, /* 3 */
env: process.env /* 4 */
});
bkWorker.on('message', (message) => {// ...});
// 子进程
process.send(/* ... */); /* 5 */
说明:
- 指定要执行的程序路径,主进程中,
process.execPath
代表的是 electron 程序路径 - 启动一个父子进程间的 IPC 通道方便我们使用
process.send
进行通信 - 设置子进程的当前工作目录
- 同步父进程的环境变量到子进程
参考:node 文档 -child_process.spawn
spawn 的子进程意外退出重启处理探究
主进程 index.js
const {spawn} = require('child_process');
let worker;
function serve () {worker = spawn(process.execPath, ['./test1.js'], {stdio: [0, 1, 2, 'ipc'],
cwd: __dirname,
env: process.env
});
worker.on('message', (...args) => {console.log('message', ...args);
});
worker.on('error', (...args) => {console.log('error', ...args);
});
worker.on('exit', (code, signal) => {console.log('exit', code, signal);
});
worker.on('disconnect', () => {console.log('disconnect');
});
// 基本子进程退出,都会触发 worker.on('close')
// 因此可以在这里做一些子进程重启之类的事
worker.on('close', (code, signal) => {console.log('close', code, signal);
// serve();});
// 先后触发 worker 的 disconnect exit close 事件,exit 参数为 null SIGTERM
// setTimeout(() => {// worker.kill();
// }, 2000);
}
// process.exit:主进程会马上退出,不会影响子进程,要退出子进程需要另做处理
// process.abort:不会影响子进程,要退出子进程需要另做处理
// throw Error:不会影响子进程,要退出子进程需要另做处理
// setTimeout(() => {// // process.exit();
// // process.abort();
// // throw new Error('1231');
// }, 10000);
setInterval(() => {console.log(process.pid, '===');
}, 1000);
serve();
子进程 test1.js
process.on('uncaughtException', (error) => {console.log('worker uncaughtException', error);
process.send({
type: 'error',
msg: error
});
});
process.send('connected');
setInterval(() => {console.log(process.pid, '---');
}, 1000);
// 会触发 worker.on('disconnect'),主 子 进程都不会退出,但连接中断,不能使用 process.send,会报错
// setTimeout(() => {// process.disconnect();
// // process.send('hello?');
// }, 3000);
// process.abort:先后触发 worker 的 disconnect exit close 事件,exit 及 close 参数为 null SIGABRT
// process.exit:先后触发 worker 的 disconnect exit close 事件,exit 及 close 参数为 0 null
// setTimeout(() => {// // process.abort();
// // process.exit();
// }, 10000);
// 用 process.on('uncaughtException') 处理
// setTimeout(() =>{// throw new Error('123');
// }, 1500);
打包后程序执行调试技巧
使用命令行运行程序
进入打包后程序所在目录,假设程序名为“Test”,则执行命令 ./Test
即可执行程序,并且程序中所有控制台输出都会打印在该终端中。我们可以借助输出信息进行调试。
asar
当 windows 打包开启 asar 时,打包后文件资源被归档到一个 asar 档案文件。如果刚好我们需要调试的话,可能需要更改代码后重新打包、安装、运行。但实际上有更方便的方式。
asar 提供命令行工具,通过命令行,我们可以打包、列出归档文件中的文件列表、解压某个单文件、解压整个档案文件等功能。
因此,我们的打包后调试过程可以被简化为:
- 关闭应用,解压打包后 asar 文件
- 修改代码,然后将修改后的文件整个重新打包,重启应用
参考:npm-asar
杂项
Linux 虚拟机的安装及常用环境搭建
虚拟机安装:http://note.youdao.com/notesh…
环境搭建:http://note.youdao.com/notesh…
VS Code 调试 Electron 配置文件
{
"version": "0.2.0",
"configurations": [
{
"name": "Electron",
"type": "node",
"request": "launch",
"cwd": "${workspaceRoot}",
"program": "${workspaceFolder}/server/index.js",
"runtimeExecutable": "${workspaceRoot}/server/node_modules/.bin/electron",
"windows": {"runtimeExecutable": "${workspaceRoot}/server/node_modules/.bin/electron.cmd"
},
"args": ["."],
"outputCapture": "std",
"env": {"NODE_ENV": "development"}
}
]
}
使用硬链接管理文件资源引用关系
文件链接有两种:硬链接与符号链接。
硬链接直接指向数据,会增加该文件的 inode 计数,数据只会存在一份,所有指向该数据的链接是同步的。在文件系统中,inode 为 0 的数据会被删除。而符号链接是记录的该文件位置,并不会增加文件的 inode 计数,平时我们使用到的快捷方式就是符号链接,目标文件删除,链接并不会消失,但这个链接指向的资源却无法再找到。
在项目中有这样一个问题:整个系统是围绕着文件资源进行的业务处理,各个模块是串联进行,上游输出是下游输入。但各个流程的资源需要允许用户隔离管理,本模块对某个资源的依赖不影响其他模块的删除。
如果要做到相互不依赖,可能的办法有:每个环节都存一份文件。但是这种方式,会浪费大量的硬盘空间,数据同步也不好处理。因此最终我们选择使用硬链接来实现该部分需求。
硬链接操作起来非常简单,在 node 中主要有以下几个操作:
const fs = require('fs');
fs.link(existingPath, newPath, callback); // 创建硬链接
fs.unlink(path, callback); // 删除硬链接
fs.stat(path[, options], callback).nlink; // 查看 inode 数
参考:
- Linux 文件链接 hard link 与 symbolic link
- 关于硬链接与软连接占用磁盘空间问题的分析研究
- node 文档 -File System
postgre 数据导出
rm -f dlp.sql&&pg_dump -U 用户名 -d 数据库名 -f 文件名.sql -h 服务器 host -p 端口 -s
参考:pg_dump
错误处理
事件相关
-
事件内抛出的错误会被外层捕获
const {EventEmitter} = require('events'); const event = new EventEmitter(); event.on('test', () => {// throw new Error('1'); try {throw new Error('2'); } catch (e) {event.emit('error', e); } }); event.on('error', (e) => {console.log(e); // Error: 2 }); try {event.emit('test'); } catch (e) {console.log(e); // Error: 1 }
同步异步相关
-
Promise 中的错误处理
await
非常关键,没有await
,try
无法捕获到catch
中throw
的错误(async () => { try {let res = await new Promise(() => {throw new Error(2); }).catch(error => {if (error.message === '1') {return Promise.resolve('haha'); } else throw error; }); console.log(res); } catch (e) {debugger;} })();
跨盘符移动文件
function moveFileCrossDevice (source, target) {return new Promise((resolve, reject) => {
try {if (!fs.existsSync(source)) reject(new BEKnownError('源文件不存在'));
let readStream = fs.createReadStream(source);
let writeStream = fs.createWriteStream(target);
readStream.on('end',function(){fs.unlinkSync(source);
resolve();});
readStream.on('error', (error) => {reject(error);
});
writeStream.on('error', (error) => {reject(error);
});
readStream.pipe(writeStream);
} catch (e) {reject(e);
}
});
}
docker 常用命令
http://note.youdao.com/notesh…