JavaScript中常用的正则表达式日常整理(全)(6)

日期：2020-06-22 栏目：程序人生浏览：次

/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/ 开始必须是一个或者多个单词字符或者是-，加上@，然后又是一个或者多个单词字符或者是-。然后是点“.”和单词字符和-的组合，可以有一个或者多个组合。

我不太了解邮箱的具体规则。感觉这个正则比较简单，EMAIL校验正则讨论求解里有比较详细的邮箱正则讨论。

匹配源代码中的链接

来源：正则

能够匹配HTML代码中链接的正则。

原帖正则：

/<a href=".+?">.+?<\/a>/g 感觉有点严格，首先要<a href="".+?">有，而且href属性可以是一个或者多个除换行外任意字符(非贪婪)。后面是.+?<\/a>，一个或者多个除换行外任意字符（非贪婪），再加上结束标签。

有个问题，如果a的起始标签最后有空格，或者除了href还有其它属性的话，上面的正则就不能匹配这个链接了。

例如：

<a href="https://www.jb51.net/article/asdfs" >……多了个空格。

<a href=""https://www.jb51.net/article/asdfs">……前面有属性。

……

重写正则：

/<a\s(\s*\w*?=".+?")*(\s*href=".+?")(\s*\w*?=".+?")*\s*>[\s\S]*?<\/a>/ 思路如下：首先要有<a和一个空格。/<a\s/

第一个(\s*\w*?=".+?")*

可以匹配一个属性，属性前面可能有或者没有多余的空格，用\s*匹配；属性名肯定是单词字符，用\w*?匹配；=".+?"就是匹配属性值了非换行字符若干个；整个括号外面加个*表示可能有任意多个属性。

(\s*href=".+?")

匹配href，它也是一个属性，所以只要把上面子正则表达式中的\w修改为href=就行了。

(\s*\w*?=".+?")*重复第一个子正则表达式，再次接受任意个属性。

\s*>，属性最后再加上若干个空格和>。

[\s\S]*?，链接的文字，可能有任何字符组成，若干个，非贪婪。

<\/a>最后是结束标签。

补充：属性名和=之间，以及=和属性值之间也可能有空格。所以要再加上几个\s*。

最后的实例代码如下：

会把所有的链接在页面直接显示出来。注意，

本帖遗留问题：如何执行从右到左的匹配。貌似JS或者VBS没有提供这个功能2、JS或者VBS不支持后行断言。。用什么方法实现这个功能。

匹配链接的文字
来源：求一正则?

代码：<a href="#>这里要保存</a>，只保存链接的文本内容，标签信息删掉。

前面写过一个匹配链接的正则：

/<a\s(\s*\w*?=".+?")*(\s*href=".+?")(\s*\w*?=".+?")*\s*>[\s\S]*?<\/a>/ 不过我们需要捕获的是文字内容，所以需要做一定的修改。第一步就是在所有的括号内都加上?:表示不捕获。第二步就是再多加一个括号放在[\s\S]*?两侧，这样就可以捕获到链接的文字内容了。最后正则如下：

/<a\s(?:\s*\w*?\s*=\s*".+?")*(?:\s*href\s*=\s*".+?")(?:\s*\w*?\s*=\s*".+?")*\s*>([\s\S]*?)<\/a>/

测试代码如下：

正则判断标签是否闭合

来源：求助超难！正则表达式如何判断一个标签是否闭合

例如：<img xxx=”xxx” 就是没有闭合的标签；

<p>p的内容，同样也是没闭合的标签。

从简单的正则开始，先匹配起始标签

/<[a-z]+/i 再加上若干属性：

/<[a-z]+(\s*\w*?\s*=\s*".+?")*/i 下面就到关键点了，标签的闭合。标签可能有两种方式闭合，<img xxx=”xxx” />

或者是<p>xxx </p>。

(\s*\/>)

匹配img类的结束，即/>。

(\s*?>[\s\S]*?<\/\1>)

匹配\p类标签的结束标签。>是其实标签末尾，之后是标签内容若干个任意字符，最后的<\/\1>就是结束标签了。

加上一个或就可以解决了，最后的完整正则表达式：

整个正则：

转载注明出处：https://www.heiqu.com/wjppzs.html

JavaScript中常用的正则表达式日常整理(全)(6)

相关推荐