在VS2008中使用正则表达式进行查找和替换(3)

匹配 Unicode 值给定的字符,其中 #### 是十六进制数。 可以用 ISO 10646 代码点或两个提供代理项对的值的 Unicode 代码点指定基本多语种平面(即一个代理项)外的字符。

 

\u0065 匹配字符“e”。

 

下表列出了用于指定 Unicode 字符属性数据库中列出的通用类别的两个字母的缩写词。 您可以在正则表达式字符集中使用这些缩写词。 例如,表达式 [:Nd:Nl:No] 匹配任何类型的数字。

表达式

 

语法

 

说明

 

大写字母

 

:Lu

 

匹配任何一个大写字母。例如:

:Luhe匹配“The”但不匹配“the”。

 

小写字母

 

:Ll

 

匹配任何一个小写字母。例如:

:Llhe匹配“the”但不匹配“The”。

 

词首大写字母

 

:Lt

 

匹配将大写字母和小写字母结合的字符,例如,Nj 和 Dz。

 

修饰符字母

 

:Lm

 

匹配字母或标点符号,例如逗号、交叉重音符和双撇号,用于表示对前一字母的修饰。

 

其他字母

 

:Lo

 

匹配其他字母,如哥特体字母 ahsa。

 

十进制数字

 

:Nd

 

匹配十进制数(如 0-9)和它们的双字节等效数。

 

字母数字

 

:Nl

 

匹配字母数字,例如罗马数字和表意数字零。

 

其他数字

 

:No

 

匹配其他数字,如旧斜体数字一。

 

开始标点符号

 

:Ps

 

匹配开始标点符号,例如左方括号和左大括号。

 

结束标点符号

 

:Pe

 

匹配结束标点符号,例如右方括号和右大括号。

 

左引号

 

:Pi

 

匹配左双引号。

 

右引号

 

:Pf

 

匹配单引号和右双引号。

 

破折号

 

:Pd

 

匹配破折号标记。

 

连接符号

 

:Pc

 

匹配下划线标记。

 

其他标点符号

 

:Po

 

匹配 (,)、?、"、!、@、#、%、&、*、\、(:)、(;)、' 和 /。

 

空白分隔符

 

:Zs

 

匹配空白。

 

行分隔符

 

:Zl

 

匹配 Unicode 字符 U+2028。

 

段落分隔符

 

:Zp

 

匹配 Unicode 字符 U+2029。

 

无间隔标记

 

:Mn

 

匹配无间隔标记。

 

组合标记

 

:Mc

 

匹配组合标记。

 

封闭标记

 

:Me

 

匹配封闭标记。

 

数学符号

 

:Sm

 

匹配 +、=、~、|、< 和 >。

 

货币符号

 

:Sc

 

匹配 $ 和其他货币符号。

 

修饰符号

 

:Sk

 

匹配修饰符号,如抑扬音、抑音符号和长音符号。

 

其他符号

 

:So

 

匹配其他符号,如版权符号、段落标记和度数符号。

 

其他控制

 

:Cc

 

匹配类似 TAB 和 NEWLINE 这样的 Unicode 控制字符。

 

其他格式

 

:Cf

 

格式控制字符,例如双向控制字符。

 

代理项

 

:Cs

 

匹配代理项对的一半。

 

其他私用

 

:Co

 

匹配私用区域的任何字符。

 

其他未分配字符

 

:Cn

 

匹配未映射到 Unicode 字符的字符。

 

除标准 Unicode 字符属性外,还可以指定下列属性作为字符集的一部分。

表达式

 

语法

 

说明

 

Alpha

 

:Al

 

匹配任何一个字符。

例如,:Alhe匹配“The”、“then”、“reached”等单词。

 

数值

 

:Nu

 

匹配任何一个数或数字。

 

标点

 

:Pu

 

匹配任何一个标点符号,如 ?、@、' 等等。

 

空白

 

:Wh

 

匹配所有类型的空白,如印刷和表意文字的空白。

 

双向

 

:Bi

 

匹配诸如阿拉伯文和希伯来文这类从右向左书写的字符。

 

朝鲜文

 

:Ha

 

匹配朝鲜文和组合朝鲜文字母。

 

平假名

 

:Hi

 

匹配平假名字符。

 

片假名

 

:Ka

 

匹配片假名字符。

 

表意文字/汉字/日文汉字

 

:Id

 

匹配表意文字字符,如汉字和日文汉字。

 
用于“查找和替换”的通配符

以下是“表达式生成器”中可用的通配符。

表达式

 

语法

 

说明

 

任何单个字符

 

?

 

匹配任何一个字符。

 

任何一个数字

 

#

 

匹配任何一个数字。例如,7# 匹配包括 7 及其后接另一数字的数字,如 71,但不包括 17。

 

不在字符集中的字符

 

[! ]

 

匹配未在字符集中指定的任何一个字符。

 

转义符

 

\

 

按原义匹配反斜杠 (\) 之后的字符。这使您可以查找在通配符表示法中使用的字符,如 * 和 #。

 

一个或多个字符

 

*

 

匹配零个或多个字符。例如,new* 匹配包括“new”的任何文本,如 newfile.txt。

 

字符集

 

[ ]

 

匹配在字符集中指定的任何一个字符。

 

您可能感兴趣的文章:

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wjpzsp.html