本文共 1703 字,大约阅读时间需要 5 分钟。
在编写程序时,或者编写网页时,在处理一些不固定的字符时,我们通常会使用形如:. * ?等字符,而我们就把这称作是正则表达式,尤其是我们在浏览一些网站进行用户注册时,通常会见到对我们的帐号、密码、邮箱等格式或复杂程度进行限制,而这一切都是正则表达式的功劳,而正则表达式在不同的环境中也是具有不同的作用的。
在正则表达式中我们一般是将这些组成正则表达式的字符称作“元字符”。在Linux下,正则表达式:
^PATTERN 行首锚定符,以PATTERN为行首开始 PATTERN$ 行尾锚定符,以PATTERN为行尾结束 \<PATTERN 词首锚定符,以PATTERN为词首开始的单词 PATTERN\> 词尾锚定符,以PATTERN为词尾结束的单词 . 匹配任意单个非空字符 * 匹配此前的字符0到任意次 .* 匹配此前长度的任意字符(当正则表达式中包含能接受重复的限定符时,通 常的行为是【在使整个表达式能得到匹配的前提下】匹配尽可能多的字符,我们将其称之为:贪婪模式) ? 匹配此前的字符0次或1次 \{m,n\} 匹配之前字符至少m次至少n次(注:匹配至少2次多则不限\{2,\} 匹配最多5次少则不限\{0,5\} 匹配5次\{5\}) [] 匹配指定范围内的任意单个字符 [^] 匹配指定范围外的任意单个字符 \(\) 标识引用和分组,做引用时,在后面要使用括号中的字符时只需输入\n, n标识次表达式中的从左至右的第几个括号;做分组作用时,是指括号中的为一组,执行共同的动作 而在Linux中我们通常使用的文本查找工具grep、egrep、fgrep都是配合正则表达式来使用的: grep:基本正则表达式; egrep:扩展正则表达式; fgrep:快速搜索全部的字符。 grep [option] file --color=auto|always 指定匹配到的字符所显示的颜色 -E 支持扩展正则表达式即:grep -E = egrep -v 取反 -i 忽略大小写 -r 搜索多个文件,即:递归搜索 -B NUMBER 显示搜索到的行的上NUMBER行 -A NUMBER 显示搜索到的行的下NUMBER行 -C NUMBER 显示搜索到的行的上下NUMBER行 -o 只显示匹配到的内容本身,并非所在的行 egrep 扩展正则表达式:扩展正则表达式对标准正则表达式的某些元字符进行了简化如: \{m,n\} ----> {m,n} \(\) ----> () 添加了: | 表示或的意思 + 匹配之前字符1次或任意次 例子: 1、搜索以redhat为行开始的行在/etc/passwd中 #grep --color=auto "^redhat" /etc/passwd 2、搜索以 :为行结尾的行在/etc/passwd中 #grep --color=auto ":$" /etc/passwd 3、搜索不是以字母r开头的单词在/etc/passwd中 #grep --color=auto -v -o "\<r" /etc/passwd 4、搜索以字母d结尾的单词在/etc/passwd中 #grep --color=auto "d\>" /etc/passwd 5、搜索形如XXX.XXX.XXX.XXX的行,X只为数字在/tmp/test/a.txt中 #grep -- color=auto "\([[:digit:]]\{3\}\.\)\{3\}[[:digit:]]\{3\}" /tmp/test/a.txt 6、搜索以其为附加组多于两个用户的组 #grep --color=auto "\(,.*\)\{2\}$" /etc/group 7、搜索密码永不过期的用户 #grep --color=auto "\(.*\)\{4\}99999" /etc/shadow 相信你看过后,对正则表达式和grep已经能够熟练使用了!