第4章 数据处理(2)

负值字符范围。匹配不在指定范围内的任意字符。例如,'[^a-z]'可以匹配不在'a' 到'z'范围内的任意字符

 
以下是几个简单的正则表达式的例子:
●'[A-Za-z0-9] ':表示所有的大写字母、小写字母及0到9的数字。
●'^hello':表示以hello开始的字符串。
●'world$':表示以world结尾的字符串。
●'.at':表示以除"\n"外的任意单个字符开头并以"at"结尾的字符串,如"cat"、"nat"等。
●'^[a-zA-Z]':表示一个以字母开头的字符串。
●'hi{2}':表示字母h后跟着两个i即hii。
●'(go)+':表示至少含有一个'go'字符串的字符串,如'gogo'
身份证号码一般由18位数字或17位数字后面加一个X或Y字母组成,要匹配身份证号码,可以写作:
^[0-9]{17}([0-9]|X|Y)$
Email地址的正则表达式可以写作:
^[a-zA-Z0-9\-]+@[a-zA-Z0-9\-]+\.[a-zA-Z0-9\-\.]+$
2.字符串的匹配
ereg()和eregi()函数
使用ereg()函数可以查找字符串与子字符串匹配的情况,并返回匹配字符串的长度,还可以借助参数返回匹配字符的数组。语法格式如下:
int ereg(string ($pattern) , string $string [, array $regs ])

复制代码 代码如下:


<?php
/*本例检查字符串是否是ISO格式的日期(YYYY-MM-DD) */
$date="1988-08-09";
$len=ereg ('([0-9]{4})-([0-9]{1,2})-([0-9]{1,2})', $date, $regs);//日期格式为YYYY-MM-DD
if ($len)
{
echo "$regs[3].$regs[2].$regs[1]". "<br>"; //输出"09.08.1988"
echo $regs[0] ."<br>"; //输出"1988-08-09"
echo $len; //输出10
}
else
{
echo "错误的日期格式: $date";
}
?>


3.字符串的替换
ereg_replace()函数语法格式如下:
string ereg_replace(string $pattern , string $replacement , string $string)
说明:函数使用字符串$replacement替换字符串$string中与$pattern匹配的部分,并返回替换后的字符串。若未找到匹配项,则原样返回

复制代码 代码如下:


<?php
$str="hello world";
echo ereg_replace('[aeo]', 'x',$str). "<br>"; //输出'hxllx wxrld'
$res='<a href=https://www.jb51.net/article/\"hello.php\">hello</a>';
echo ereg_replace('hello', $res,$str); //使用超链接替换'hello'
?>


4.分割数组

使用split()函数可以完成与explode()函数一样的功能,而且可以根据给出的正则表达式来分割字符串,并返回一个数组。语法格式如下:

array split(string $pattern , string $string [, int $limit ])

5.产生正则表达式

3.Perl兼容的正则表达式

1.编写正则表达式

表4.4 Perl兼容正则表达式扩充的语法格式

字 符

 

描 述

 

\b

 

匹配一个单词边界,也就是指单词和空格间的位置。例如,'er\b'可以匹配"never"中的 'er',但不能匹配"verb"中的'er'

 

\B

 

匹配非单词边界。'er\B'能匹配"verb"中的'er',但不能匹配"never"中的'er'

 

\cx

 

匹配由x指明的控制字符。例如,'\cM'匹配一个Control-M或回车符。x的值必须为A~Z或a~z之一。否则,将'c'视为一个原义的'c'字符

 

\d

 

匹配一个数字字符。等价于'[0-9]'

 

\D

 

匹配一个非数字字符。等价于'[^0-9]'

 

\f

 

匹配一个换页符。等价于'\x0c'和'\cL'

 

\n

 

匹配一个换行符。等价于'\x0a'和'\cJ'

 

\r

 

匹配一个回车符。等价于'\x0d'和'\cM'

 

\s

 

匹配任何空白字符,包括空格、制表符、换页符等。等价于' [ \f\n\r\t\v] '

 

\S

 

匹配任何非空白字符。等价于' [^ \f\n\r\t\v] '

 

\t

 

匹配一个制表符。等价于'\x09'和'\cI'

 

\v

 

匹配一个垂直制表符。等价于'\x0b'和'\cK'

 

\w

 

匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'

 

\W

 

匹配任何非单词字符,等价于'[^A-Za-z0-9_]'

 

\xn

 

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/943878821f4adef4ade32a50854c65ab.html