正则表达式是基于样式匹配的文本处理技术的关键所在,我们需要对文本匹配有基本的理解,正则表达式是一种通过通配符技术,将文本高度匹配的技术
正则表达式是一种绝大多数文本处理工具的语言,
首先是分为了POSIX字符和元字符
正则表达式的基本组成
首先是基础规则
POSIX字符类是一个形如 [:…:]的特殊元序列,表示字符类型
元字符是一种Perl风格的正则表达式,可能有些不支持
我们只需要构建出合适的正则表达式,就可以进行匹配对应的文本
( ?[a-zA-Z]+ ? )
?匹配单词前后可能的空格
[a-zA-Z] 表示代表1-多个字母
假如,为了匹配一个IP地址,可以使用如下的正则表达式
如何在正则表达式中指定某些字符的特殊含义
$ ^ . * + {} 都是具有特殊含义的
比如如下的正则比到时
[a-z]*.[0-9]是什么意思
可以匹配0或多个[a-z] 然后接一个随意字符,然后接 [0-9]任意字符
如果不想要这些字符可以有特殊含义,可以放上一个 \ 表示进行转义