明天分享的学习笔记内容是Linux三剑客,包含grep、sed、awk命令的基础知识,以及一些正则表达式相干内容。

正则表达式是对字符串和特殊字符操作的一种逻辑公式,就是用当时定义好的一些特定字符及这些特定字符的组合,组成一个“规定字符串”,这个“规定字符串”用来表白对字符串的一种过滤逻辑。


正则表达式应用单个字符串来形容、匹配一系列匹配某个句法规定的字符串,通常被用来检索、替换那些合乎某个规定的文本,sed、awk、grep命令可能实现这种性能。


文本搜寻grep函数

grep是一个文本搜寻工具,反对正则表达式,可能把匹配的行显示进去。egrep是扩大版反对更多元字符,笔记里提到的为grep。语法格局如下:

grep '条件' file.name -x(参数)

命令常见参数选项(-x):

  • i:疏忽大小写
  • v:输入反转后果
  • x:准确匹配整行内容
  • -color:高亮显示匹配行
  • n:输入同时显示行号
  • c:计算合乎款式的行数
  • q:不显示任何信息

简略示例

grep '^abc' xx.txt输入以abc结尾的行grep '[0-9]' xx.txt输入蕴含数字的行grep '^$' xx.txt输入空行grep 'xyz$' xx.txt输入以xyz结尾的行grep 'a*c' xx.txt输入a结尾c结尾的行

文本处理awk函数

awk最根本的性能是基于指定规定浏览和抽取信息,awk抽取信息后,能力进行其余文本操作,残缺的awk脚本通常用来格式化文本文件中的信息。通常,awk是以文件的一行为解决单位。语法格局如下:

awk '{pattern + action}'{filenames}awk 'BEGIN{OFS=FS="\t"}{print $0, $1;}' filenameawk 'BEGIN{OFS=FS="\t"}ARGIND==1{print $0, $1;}ARGIND==2{print $0;}' file1 file2

awk运算符:

awk内置变量:

常见参数解释

  • OFS:输入时列分隔符
  • FS:输出时列分隔符
  • $0:第一行
  • $1\$2\$NF:第一列、第二列、最初一列
  • NF:总列数
  • NR:总行数
  • FNR:以后读取了多少行
  • F:指定分隔符

    实例演示

  • 输入20到30行的内容

    awk '{if(NR>=20 && NR<=30) print $1}' test.txt

    文本替换sed函数

    sed一次解决一行内容。解决时,把以后解决的行存储在长期缓冲区中,接着用sed命令解决缓冲区中的内容,解决实现后,把缓冲区的内容送往屏幕。而后读入上行,执行下一个循环。这样一直反复,直到文件开端。

  • 语法格局为:

    sed [-nefri等参数] ‘command’ 输出文本 sed -i 's/被替换的内容/要替换成的内容/' filesed 's/被替换的内容/要替换成的内容/g' file > file.out
    • n∶宁静模式。只有通过sed 非凡解决的那一行才会被列出来。
    • e∶间接在指令列模式上进行 sed 的动作编辑;
  • f∶间接将 sed 的动作写在一个档案内,
  • r∶sed 延长型正则表示法的语法。(预设是根底正则表示法语法)
  • i∶间接批改读取的档案内容,而不是输入。

    实例展现

删除文件第3行sed '3d' xxx.txt删除文件最初一行sed "$d" xxx.txt删除空格sed ’s/^[ ]*//g’ xxx.txt替换:把test替换为mytest。如果没有g标记,则只有每行第一个匹配的test被替换成mytest。sed 's/test/mytest/g' xxx.txt增加新行(向前)sed ‘s/pattern/&\n/g’ filename在最初一行插入字符sed -i ‘$ a\插入字符串’ filename
参考资料
https://www.cnblogs.com/ginvi...
https://baike.baidu.com/item/...
http://www.ehbio.com/Bioinfo_...

本文由mdnice多平台公布