SQL Anywhere正则表达式语法与示例

正则表达式语法

通过 SIMILAR TO 和 REGEXP 搜索条件以及 REGEXP_SUBSTR 函数支持正则表达式。对于 SIMILAR TO,正则表达式语法符合 ANSI/ISO SQL 标准。对于 REGEXP 和 REGEXP_SUBSTR,正则表达式的语法和支持符合 Perl 5。

REGEXP 和 SIMILAR TO 使用正则表达式是与字符串 相匹配,而 REGEXP_SUBSTR 使用正则表达式则是与子串 相匹配。要实现 REGEXP 和 SIMILAR TO 的子串匹配行为,可在要尝试匹配的模式的任何一侧指定通配符。例如,REGEXP '.*car.*' 会与 car、carwash 和 vicar 匹配。或者,可重写查询以使用 REGEXP_SUBSTR 函数。请参见REGEXP_SUBSTR 函数 [String]

通过 SIMILAR TO 匹配的正则表达式不区分大小写,也不区分重音。REGEXP 和 REGEXP_SUBSTR 不受数据库区分重音和大小写的影响。请参见。

正则表达式:元字符

元字符是在正则表达式中具有特殊含义的符号或字符。

元字符的处理视以下情况而异:

正则表达式是与 SIMILAR TO 或 REGEXP 搜索条件一起使用,还是与 REGEXP_SUBSTR 函数一起使用

元字符是否在正则表达式的字符类的内部

在继续之前,应了解字符类的定义。字符类是一组括在方括号内的字符,将根据这组字符对字符串中的字符进行匹配。例如,在 SIMILAR TO 'ab[1-9]' 语法中,[1-9] 就是一个字符类,它与 1 到 9 范围中(包括 1 和 9)的某一数字匹配。正则表达式中元字符的处理方式各不相同,这取决于元字符是否被放在字符类的内部。具体来说,当元字符放在字符类的内部时,多数元字符作为常规字符来处理。

对于 SIMILAR TO(仅限于 SIMILAR TO),元字符 *、?、+、_、|、(、)、{ 必须在字符类内进行转义。

要在字符类中包括减号 (-)、脱字符 (^) 或直角方括号 (]) 字符,必须将字符转义。

下面给出了所支持的正则表达式元字符的列表。当 SIMILAR TO、REGEXP 和 REGEXP_SUBSTR 使用元字符时,几乎所有元字符的处理方式都相同:

字符 其它信息
[]   左右方括号用于指定字符类。字符类是进行匹配时所要依据的一组字符。

除连字符 (-) 和脱字符 (^) 外,在字符类中指定的元字符和量词(如 * 和 {m},分别为元字符和量词)没有特殊意义,可当作实际字符进行运算。

SQL Anywhere 还支持子字符类,例如 POSIX 字符类。请参见。

 
*   星号可用于与字符匹配 0 次或多次。例如,REGEXP '.*abc' 匹配的字符串以 abc 结尾并以任何前缀开头。因此,aabc、xyzabc 和 abc 匹配,但 bc 和 abcc 则不匹配。  
?   问号可用于与字符匹配 0 次或 1 次。例如,'colou?r' 匹配 color 和 colour。  
+   加号可用于与字符匹配 1 次或多次。例如,'bre+' 匹配 bre 和 bree,但不匹配 br。  
-   可以在字符类中使用一个连字符来表示一个范围。例如,REGEXP '[a-e]' 匹配 a、b、c、d 和 e。

有关 REGEXP 和 SIMILAR TO 如何对范围求值的详细信息,请参见。

 
%   百分号可与 SIMILAR TO 配合使用来匹配任意数目的字符。

不将百分号视为 REGEXP 和 REGEXP_SUBSTR 所使用的元字符。当指定时,它匹配百分号 (%)。

 
_(下划线字符)   可将下划线与 SIMILAR TO 配合使用来匹配单个字符。

不将下划线视为 REGEXP 和 REGEXP_SUBSTR 所使用的元字符。当指定时,它匹配下划线 (_)。

 
|   管道符号用于指定匹配字符串时要使用的替代模式。在由竖线分隔的一行模式中,竖线被解释为 OR,匹配过程从最左侧的模式开始,在找到第一个匹配项时停止。因此,您应按优先级的降序顺序列出模式。您可以指定任意数量的替代模式。  
()   当左括号和右括号用于正则表达式的各个组合部分时,它们为元字符。例如,(ab)* 匹配零个或多个 ab 的重复项。与使用数学表达式一样,您使用组合来控制正则表达式各部分的计算顺序。  
{}   当左大括号和右大括号用于指定量词时,它们为元字符。量词指定一个模式要构成某个匹配所必须重复的次数。例如:

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wyfgpd.html