共计 2043 个字符,预计需要花费 6 分钟才能阅读完成。
原文:https://lwebapp.com/zh/post/r…
需要
最近有小伙伴提了个需要,想用正则表达式从一段 git 提交记录中提取出具体更新了哪些代码,简略来说就是 commit diff 展现的代码,须要把 代码后面带 +
和 -
的行剥离进去。
咱们从 RichX 我的项目复制进去一段提交记录,稍作批改用于演示。
+ import {Plugin} from "..";
- CONST SUM = NUM_A + NUM_B;
+ CONST SUM_ALL = NUM_A + NUM_B;
export const DEFAULT_RICH_TEXT = {
- text: "Simple Rich Text Demo",
+ config: "Simple Rich Text Demo",
setting: [],};
export type ObjectKV<V = object> = {[key: string]: V;
};
+ export interface IPlugins {+ [key: string]: Plugin;
+ }
咱们把需要转换下,就是正则匹配多行文本中以 +
和 -
结尾的行。
解法一
思路:
- 首先匹配
+
结尾的字符:\+.*
- 而后带上
-
:(\+|\-).*
- 因为多行文本之间是有换行符宰割的,所以
+
结尾的单行文本的后面一个字符,就是上一行最初的换行符\n
,同样的,这一行的结尾也是换行符。所以咱们利用正则断言,将两个换行符匹配指标文本的首尾即可:(?<=\n)(\+|\-).*(?=\n)
- 最初还要思考两个非凡状况,整个文本的首尾地位。首位没有上一行所以匹配不到换行符
\n
,只能匹配结尾^
,结尾前面也可能没有换行符,用$
代替:(?<=^|\n)(\+|\-).*(?=\n|$)
代码:
const content = `+ import {Plugin} from "..";
- CONST SUM = NUM_A + NUM_B;
+ CONST SUM_ALL = NUM_A + NUM_B;
export const DEFAULT_RICH_TEXT = {
- text: "Simple Rich Text Demo",
+ config: "Simple Rich Text Demo",
setting: [],};
export type ObjectKV<V = object> = {[key: string]: V;
};
+ export interface IPlugins {+ [key: string]: Plugin;
+ }`
content.match(/(?<=^|\n)(\+|\-).*(?=\n|$)/g)
// 输入数组
// 0: "+ import {Plugin} from \"..\";"
// 1: "- CONST SUM = NUM_A + NUM_B;"
// 2: "+ CONST SUM_ALL = NUM_A + NUM_B;"
// 3: "- text: \"Simple Rich Text Demo\","
// 4: "+ config: \"Simple Rich Text Demo\","
// 5: "+ export interface IPlugins {"
// 6: "+ [key: string]: Plugin;"
// 7: "+ }"
解法二
思路:
下面的计划要本人匹配换行符,有点麻烦。咱们能够省去本人判断换行符的步骤,间接匹配每一行的首尾,再应用正则表达式标记 m
启用多行匹配模式:/^(\+|\-).*$/gm
。
代码:
const content = `+ import {Plugin} from "..";
- CONST SUM = NUM_A + NUM_B;
+ CONST SUM_ALL = NUM_A + NUM_B;
export const DEFAULT_RICH_TEXT = {
- text: "Simple Rich Text Demo",
+ config: "Simple Rich Text Demo",
setting: [],};
export type ObjectKV<V = object> = {[key: string]: V;
};
+ export interface IPlugins {+ [key: string]: Plugin;
+ }`
content.match(/^(\+|\-).*$/gm)
// 输入数组
// 0: "+ import {Plugin} from \"..\";"
// 1: "- CONST SUM = NUM_A + NUM_B;"
// 2: "+ CONST SUM_ALL = NUM_A + NUM_B;"
// 3: "- text: \"Simple Rich Text Demo\","
// 4: "+ config: \"Simple Rich Text Demo\","
// 5: "+ export interface IPlugins {"
// 6: "+ [key: string]: Plugin;"
// 7: "+ }"
总结
以上就是和小伙伴一起探讨出的一点写正则表达式的教训,次要学习了断言和多行匹配标记。这里的案例还比较简单,后续有更深刻应用案例再和大家分享,欢送关注咱们的更新 #regex。
参考
- 正则匹配多行文本
- js 正则格式化日期工夫主动补 0
- MDN 正则断言
- 编写一个函数,将除最初四个字符之外的所有字符都改为’#’
正文完
发表至: javascript
2022-04-13