共计 4753 个字符,预计需要花费 12 分钟才能阅读完成。
grep(global search regular expression(RE) and print out the line,全面搜寻正则表达式并把行打印进去)是一种弱小的文本搜寻工具,它能应用正则表达式搜寻文本,并把匹配的行打印进去。用于过滤 / 搜寻的特定字符。可应用正则表达式能配合多种命令应用,应用上非常灵便。
命令格局
grep [options] [pattern] [file ...]
命令性能
用于过滤 / 搜寻的特定字符
options
- -a –text # 不要疏忽二进制数据。
- -A < 显示行数 > –after-context=< 显示行数 > # 除了显示合乎范本款式的那一行之外,并显示该行之后的内容。
- -b –byte-offset # 在显示合乎范本款式的那一行之外,并显示该行之前的内容。
- -B< 显示行数 > –before-context=< 显示行数 > # 除了显示合乎款式的那一行之外,并显示该行之前的内容。
- -c –count # 计算合乎范本款式的列数。
- -C< 显示行数 > –context=< 显示行数 > 或 -< 显示行数 > # 除了显示合乎范本款式的那一列之外,并显示该列之前后的内容。
- -d< 进行动作 > –directories=< 动作 > # 当指定要查找的是目录而非文件时,必须应用这项参数,否则 grep 命令将回报信息并进行动作。
- -e< 范本款式 > –regexp=< 范本款式 > # 指定字符串作为查找文件内容的范本款式。
- -E –extended-regexp # 将范本款式为延长的一般表示法来应用,意味着应用能应用扩大正则表达式。
- -f< 范本文件 > –file=< 规定文件 > # 指定范本文件,其内容有一个或多个范本款式,让 grep 查找合乎范本条件的文件内容,格局为每一列的范本款式。
- -F –fixed-regexp # 将范本款式视为固定字符串的列表。
- -G –basic-regexp # 将范本款式视为一般的表示法来应用。
- -h –no-filename # 在显示合乎范本款式的那一列之前,不标示该列所属的文件名称。
- -H –with-filename # 在显示合乎范本款式的那一列之前,标示该列的文件名称。
- -i –ignore-case # 疏忽字符大小写的差异。
- -l –file-with-matches # 列出文件内容合乎指定的范本款式的文件名称。
- -L –files-without-match # 列出文件内容不合乎指定的范本款式的文件名称。
- -n –line-number # 在显示合乎范本款式的那一列之前,标示出该列的编号。
- -P –perl-regexp # PATTERN 是一个 Perl 正则表达式
- -q –quiet 或 –silent # 不显示任何信息。
- -R/-r –recursive # 此参数的成果和指定“-d recurse”参数雷同。
- -s –no-messages # 不显示错误信息。
- -v –revert-match # 反转查找。
- -V –version # 显示版本信息。
- -w –word-regexp # 只显示全字合乎的列。
- -x –line-regexp # 只显示全列合乎的列。
- -y # 此参数成果跟“-i”雷同。
- -o # 只输入文件中匹配到的局部。
- -m <num> –max-count=<num> # 找到 num 行后果后进行查找,用来限度匹配行数
pattern
^
# 锚定行的开始 如:’^grep’ 匹配所有以 grep 结尾的行。$
# 锚定行的完结 如:’grep$’ 匹配所有以 grep 结尾的行。.
# 匹配一个非换行符的字符 如:’gr.p’ 匹配 gr 后接一个任意字符,而后是 p。*
# 匹配零个或多个先前字符 如:’*grep’ 匹配所有一个或多个空格后紧跟 grep 的行。.*
# 一起用代表任意字符。[]
# 匹配一个指定范畴内的字符,如 '[Gg]rep’ 匹配 Grep 和 grep。[^]
# 匹配一个不在指定范畴内的字符,如:’1rep’ 匹配不蕴含 A - R 和 T - Z 的一个字母结尾,紧跟 rep 的行。\(..\)
# 标记匹配字符,如 '(love)’,love 被标记为 1。\<
# 锚定单词的开始,如:’\<grep’ 匹配蕴含以 grep 结尾的单词的行。\>
# 锚定单词的完结,如 ’grep\>’ 匹配蕴含以 grep 结尾的单词的行。x\{m\}
# 反复字符 x,m 次,如:’0{5}’ 匹配蕴含 5 个 o 的行。x\{m,\}
# 反复字符 x, 至多 m 次,如:’o{5,}’ 匹配至多有 5 个 o 的行。x\{m,n\}
# 反复字符 x,至多 m 次,不多于 n 次,如:’o{5,10}’ 匹配 5 –10 个 o 的行。\w
# 匹配文字和数字字符,也就是[A-Za-z0-9],如:’G\w*p’ 匹配以 G 后跟零个或多个文字或数字字符,而后是 p。\W
# \w 的反置模式,匹配一个或多个非单词字符,如点号句号等。\b
# 单词锁定符,如: ‘\bgrep\b’ 只匹配 grep。
POSIX 字符
为了在不同国家的字符编码中保持一致,POSIX(The Portable Operating System Interface)减少了非凡的字符类,如 [:alnum:] 是[A-Za-z0-9]的另一个写法。要把它们放到 [] 号内能力成为正则表达式,如 [A- Za-z0-9] 或[[:alnum:]]。在 linux 下的 grep 除 fgrep 外,都反对 POSIX 的字符类。
- [:alnum:] #文字数字字符
- [:alpha:] #文字字符
- [:digit:] #数字字符
- [:graph:] #非空字符(非空格、控制字符)
- [:lower:] #小写字符
- [:cntrl:] #控制字符
- [:print:] #非空字符(包含空格)
- [:punct:] #标点符号
- [:space:] #所有空白字符(新行,空格,制表符)
- [:upper:] #大写字符
- [:xdigit:] #十六进制数字(0-9,a-f,A-F)
查找指定过程
> ps -ef | grep java
root 16934 1 0 Feb25 ? 00:12:23 java -jar demo.jar
root 6891 2151 0 21:42 pts/2 00:00:00 grep --color=auto java
第一条记录是查找出的过程;第二条后果是 grep 过程自身,并非真正要找的过程。
查找过程的个数
> ps -ef | grep -c java
10
> ps -ef | grep java -c
10
查找文件中的关键词
> cat rumenz.txt
rumenz.txt
one
tow
qaz
redis
linux123
linuxxxx
rumenz
123
789
> grep "linux" rumenz.txt
linux123
linuxxxx
// -n 显示行号
> grep -n "linux" rumenz.txt
6:linux123
7:linuxxxx
从文件中读取关键词进行搜寻
// 待查找的文本
> cat rumenz.txt
rumenz.txt
one
tow
qaz
redis
linux123
linuxxxx
rumenz
123
789
// 须要查找的多个关键词
> cat k.txt
linux
redis
> cat rumenz.txt | grep -f k.txt
redis
linux123
linuxxxx
// 显示行号
> cat rumenz.txt | grep -nf k.txt
5:redis
6:linux123
7:linuxxxx
输入 rumenz.txt 文件中含有从 k.txt 文件中读取出的关键词的内容行,
-n
显示行号
从多个文件中查找关键词
> grep "linux" rumenz.txt rumenz123.txt
rumenz.txt:linux123
rumenz.txt:linuxxxx
rumenz123.txt:linux123
rumenz123.txt:linuxxxx
rumenz123.txt:linux100
多文件时,输入查问到的信息内容行时,会把文件的命名在行最后面输入并且加上 ”:” 作为标示符
从多个文件中查找关键词, 应用通配符
// 查找当前目录下所有以 rumenz 结尾的文件
> grep "linux" rumenz*
rumenz123.txt:linux123
rumenz123.txt:linuxxxx
rumenz123.txt:linux100
rumenz.txt:linux123
rumenz.txt:linuxxxx
// 查找当前目录下所有以.txt 结尾的文件
> grep "linux" *.txt
k.txt:linux
rumenz123.txt:linux123
rumenz123.txt:linuxxxx
rumenz123.txt:linux100
rumenz.txt:linux123
rumenz.txt:linuxxxx
grep 不显示自身过程
> ps -ef | grep redis | grep -v grep
root 14383 1 0 Jan08 ? 01:16:03 /opt/redis-5.0.8/src/redis-server *:6379
polkitd 31977 31941 0 Jan11 ? 01:14:22 redis-server *:6379
grep -v grep
不显示grep
过程自身
找出以 r 结尾的行内容
> cat rumenz.txt | grep ^r
rumenz.txt
redis
rumenz
找出非 r 结尾的行内容
> cat rumenz.txt | grep ^[^r]
one
tow
qaz
linux123
linuxxxx
123
789
输入以 3 结尾的行内容
> cat rumenz.txt | grep 3$
linux123
123
显示蕴含 li 或者 23 字符的内容行
> at rumenz.txt | grep -E "li|23"
linux123
linuxxxx
123
查找指定格局的文件
显示当前目录上面以.txt 结尾的文件中的所有蕴含每个字符串至多有 3 个间断小写字符的字符串的行
> grep "[a-z]\{3\}" *.txt
k.txt:linux
k.txt:redis
rumenz123.txt:rumenz.txt
rumenz123.txt:one
rumenz123.txt:tow
rumenz123.txt:qaz
rumenz123.txt:redis
rumenz123.txt:linux123
rumenz123.txt:linuxxxx
rumenz123.txt:rumenz
rumenz123.txt:linux100
rumenz.txt:rumenz.txt
rumenz.txt:one
rumenz.txt:tow
rumenz.txt:qaz
rumenz.txt:redis
rumenz.txt:linux123
rumenz.txt:linuxxxx
rumenz.txt:rumenz
以递归的形式查找符合条件的文件
> grep -rl "rumenz" /root/test/
/root/test/src/sbin/patch.log
/root/test/src/doc/rumenz.txt
/root/test/src/doc/rumenz123.txt
/root/test/src/InfiniteLoop.class
/root/test/src/InfiniteLoop.java
查找 rumenz.txt
中蕴含 linux
行的前 2 行
> grep -B 2 "linux" rumenz.txt
qaz
redis
linux123
linuxxxx
查找 rumenz.txt
中蕴含 linux
行的后 2 行
> grep -A 2 "linux" rumenz.txt
linux123
linuxxxx
rumenz
123
查找 rumenz.txt
中蕴含 linux
行的前后各 2 行
> grep -C 2 "linux" rumenz.txt
qaz
redis
linux123
linuxxxx
rumenz
123
原文链接:https://rumenz.com/rumenbiji/…
微信公众号: 入门小站
- A-FH-Z ↩
正文完