乐趣区

关于linux:Linux之grep命令

grep(global search regular expression(RE) and print out the line,全面搜寻正则表达式并把行打印进去)是一种弱小的文本搜寻工具,它能应用正则表达式搜寻文本,并把匹配的行打印进去。用于过滤 / 搜寻的特定字符。可应用正则表达式能配合多种命令应用,应用上非常灵便。

命令格局

grep [options] [pattern] [file ...]

命令性能

用于过滤 / 搜寻的特定字符

options

  • -a –text # 不要疏忽二进制数据。
  • -A < 显示行数 > –after-context=< 显示行数 > # 除了显示合乎范本款式的那一行之外,并显示该行之后的内容。
  • -b –byte-offset # 在显示合乎范本款式的那一行之外,并显示该行之前的内容。
  • -B< 显示行数 > –before-context=< 显示行数 > # 除了显示合乎款式的那一行之外,并显示该行之前的内容。
  • -c –count # 计算合乎范本款式的列数。
  • -C< 显示行数 > –context=< 显示行数 > 或 -< 显示行数 > # 除了显示合乎范本款式的那一列之外,并显示该列之前后的内容。
  • -d< 进行动作 > –directories=< 动作 > # 当指定要查找的是目录而非文件时,必须应用这项参数,否则 grep 命令将回报信息并进行动作。
  • -e< 范本款式 > –regexp=< 范本款式 > # 指定字符串作为查找文件内容的范本款式。
  • -E –extended-regexp # 将范本款式为延长的一般表示法来应用,意味着应用能应用扩大正则表达式。
  • -f< 范本文件 > –file=< 规定文件 > # 指定范本文件,其内容有一个或多个范本款式,让 grep 查找合乎范本条件的文件内容,格局为每一列的范本款式。
  • -F –fixed-regexp # 将范本款式视为固定字符串的列表。
  • -G –basic-regexp # 将范本款式视为一般的表示法来应用。
  • -h –no-filename # 在显示合乎范本款式的那一列之前,不标示该列所属的文件名称。
  • -H –with-filename # 在显示合乎范本款式的那一列之前,标示该列的文件名称。
  • -i –ignore-case # 疏忽字符大小写的差异。
  • -l –file-with-matches # 列出文件内容合乎指定的范本款式的文件名称。
  • -L –files-without-match # 列出文件内容不合乎指定的范本款式的文件名称。
  • -n –line-number # 在显示合乎范本款式的那一列之前,标示出该列的编号。
  • -P –perl-regexp # PATTERN 是一个 Perl 正则表达式
  • -q –quiet 或 –silent # 不显示任何信息。
  • -R/-r –recursive # 此参数的成果和指定“-d recurse”参数雷同。
  • -s –no-messages # 不显示错误信息。
  • -v –revert-match # 反转查找。
  • -V –version # 显示版本信息。
  • -w –word-regexp # 只显示全字合乎的列。
  • -x –line-regexp # 只显示全列合乎的列。
  • -y # 此参数成果跟“-i”雷同。
  • -o # 只输入文件中匹配到的局部。
  • -m <num> –max-count=<num> # 找到 num 行后果后进行查找,用来限度匹配行数

pattern

  • ^ # 锚定行的开始 如:’^grep’ 匹配所有以 grep 结尾的行。
  • $ # 锚定行的完结 如:’grep$’ 匹配所有以 grep 结尾的行。
  • . # 匹配一个非换行符的字符 如:’gr.p’ 匹配 gr 后接一个任意字符,而后是 p。
  • * # 匹配零个或多个先前字符 如:’*grep’ 匹配所有一个或多个空格后紧跟 grep 的行。
  • .* # 一起用代表任意字符。
  • [] # 匹配一个指定范畴内的字符,如 '[Gg]rep’ 匹配 Grep 和 grep。
  • [^] # 匹配一个不在指定范畴内的字符,如:’1rep’ 匹配不蕴含 A - R 和 T - Z 的一个字母结尾,紧跟 rep 的行。
  • \(..\) # 标记匹配字符,如 '(love)’,love 被标记为 1。
  • \< # 锚定单词的开始,如:’\<grep’ 匹配蕴含以 grep 结尾的单词的行。
  • \> # 锚定单词的完结,如 ’grep\>’ 匹配蕴含以 grep 结尾的单词的行。
  • x\{m\} # 反复字符 x,m 次,如:’0{5}’ 匹配蕴含 5 个 o 的行。
  • x\{m,\} # 反复字符 x, 至多 m 次,如:’o{5,}’ 匹配至多有 5 个 o 的行。
  • x\{m,n\} # 反复字符 x,至多 m 次,不多于 n 次,如:’o{5,10}’ 匹配 5 –10 个 o 的行。
  • \w # 匹配文字和数字字符,也就是[A-Za-z0-9],如:’G\w*p’ 匹配以 G 后跟零个或多个文字或数字字符,而后是 p。
  • \W # \w 的反置模式,匹配一个或多个非单词字符,如点号句号等。
  • \b # 单词锁定符,如: ‘\bgrep\b’ 只匹配 grep。

POSIX 字符

为了在不同国家的字符编码中保持一致,POSIX(The Portable Operating System Interface)减少了非凡的字符类,如 [:alnum:] 是[A-Za-z0-9]的另一个写法。要把它们放到 [] 号内能力成为正则表达式,如 [A- Za-z0-9] 或[[:alnum:]]。在 linux 下的 grep 除 fgrep 外,都反对 POSIX 的字符类。

  • [:alnum:] #文字数字字符
  • [:alpha:] #文字字符
  • [:digit:] #数字字符
  • [:graph:] #非空字符(非空格、控制字符)
  • [:lower:] #小写字符
  • [:cntrl:] #控制字符
  • [:print:] #非空字符(包含空格)
  • [:punct:] #标点符号
  • [:space:] #所有空白字符(新行,空格,制表符)
  • [:upper:] #大写字符
  • [:xdigit:] #十六进制数字(0-9,a-f,A-F)

查找指定过程

> ps -ef | grep java
root     16934     1  0 Feb25 ?        00:12:23 java -jar demo.jar
root      6891  2151  0 21:42 pts/2    00:00:00 grep --color=auto java

第一条记录是查找出的过程;第二条后果是 grep 过程自身,并非真正要找的过程。

查找过程的个数

> ps -ef | grep -c java
10

> ps -ef | grep java -c
10

查找文件中的关键词

> cat rumenz.txt 
rumenz.txt
one
tow
qaz
redis
linux123
linuxxxx
rumenz
123
789

> grep "linux" rumenz.txt 
linux123
linuxxxx

// -n 显示行号

> grep -n "linux" rumenz.txt 
6:linux123
7:linuxxxx

从文件中读取关键词进行搜寻

// 待查找的文本
> cat rumenz.txt 
rumenz.txt
one
tow
qaz
redis
linux123
linuxxxx
rumenz
123
789

// 须要查找的多个关键词

> cat k.txt 
linux
redis

> cat rumenz.txt | grep -f k.txt
redis
linux123
linuxxxx

// 显示行号

> cat rumenz.txt | grep -nf k.txt 
5:redis
6:linux123
7:linuxxxx

输入 rumenz.txt 文件中含有从 k.txt 文件中读取出的关键词的内容行,-n显示行号

从多个文件中查找关键词

> grep "linux" rumenz.txt rumenz123.txt 
rumenz.txt:linux123
rumenz.txt:linuxxxx
rumenz123.txt:linux123
rumenz123.txt:linuxxxx
rumenz123.txt:linux100

多文件时,输入查问到的信息内容行时,会把文件的命名在行最后面输入并且加上 ”:” 作为标示符

从多个文件中查找关键词, 应用通配符


// 查找当前目录下所有以 rumenz 结尾的文件
> grep "linux" rumenz*
rumenz123.txt:linux123
rumenz123.txt:linuxxxx
rumenz123.txt:linux100
rumenz.txt:linux123
rumenz.txt:linuxxxx

// 查找当前目录下所有以.txt 结尾的文件

> grep "linux" *.txt
k.txt:linux
rumenz123.txt:linux123
rumenz123.txt:linuxxxx
rumenz123.txt:linux100
rumenz.txt:linux123
rumenz.txt:linuxxxx

grep 不显示自身过程

> ps -ef | grep redis | grep -v grep
root     14383     1  0 Jan08 ?        01:16:03 /opt/redis-5.0.8/src/redis-server *:6379
polkitd  31977 31941  0 Jan11 ?        01:14:22 redis-server *:6379

grep -v grep不显示 grep 过程自身

找出以 r 结尾的行内容

> cat rumenz.txt | grep ^r
rumenz.txt
redis
rumenz

找出非 r 结尾的行内容

> cat rumenz.txt | grep ^[^r]
one
tow
qaz
linux123
linuxxxx
123
789

输入以 3 结尾的行内容

> cat rumenz.txt | grep 3$
linux123
123

显示蕴含 li 或者 23 字符的内容行

> at rumenz.txt | grep -E "li|23"
linux123
linuxxxx
123

查找指定格局的文件

显示当前目录上面以.txt 结尾的文件中的所有蕴含每个字符串至多有 3 个间断小写字符的字符串的行

> grep "[a-z]\{3\}" *.txt
k.txt:linux
k.txt:redis
rumenz123.txt:rumenz.txt
rumenz123.txt:one
rumenz123.txt:tow
rumenz123.txt:qaz
rumenz123.txt:redis
rumenz123.txt:linux123
rumenz123.txt:linuxxxx
rumenz123.txt:rumenz
rumenz123.txt:linux100
rumenz.txt:rumenz.txt
rumenz.txt:one
rumenz.txt:tow
rumenz.txt:qaz
rumenz.txt:redis
rumenz.txt:linux123
rumenz.txt:linuxxxx
rumenz.txt:rumenz

以递归的形式查找符合条件的文件

> grep  -rl "rumenz" /root/test/
/root/test/src/sbin/patch.log
/root/test/src/doc/rumenz.txt
/root/test/src/doc/rumenz123.txt
/root/test/src/InfiniteLoop.class
/root/test/src/InfiniteLoop.java

查找 rumenz.txt 中蕴含 linux 行的前 2 行

> grep -B 2 "linux" rumenz.txt
qaz
redis
linux123
linuxxxx

查找 rumenz.txt 中蕴含 linux 行的后 2 行

> grep -A 2 "linux" rumenz.txt
linux123
linuxxxx
rumenz
123

查找 rumenz.txt 中蕴含 linux 行的前后各 2 行

> grep -C 2 "linux" rumenz.txt
qaz
redis
linux123
linuxxxx
rumenz
123

原文链接:https://rumenz.com/rumenbiji/…
微信公众号: 入门小站


  1. A-FH-Z ↩
退出移动版