PHP正则删除HTML代码中宽高样式的方法

因工作需要,需要采集html,并把html内容保存到数据库中。为了避免影响使用,宽高样式需要删除。例如图片和div中的width, height等。

不过采集到的html中,样式的写法各有不同,例如大小写,中间有空格等。

因此使用php正则编写了下面这个方法,对这些奇葩的样式进行过滤。

代码如下:

<?php /** * 清除宽高样式 * @param String $content 内容 * @return String */ function clear_wh($content){ $config = array('width', 'height'); foreach($config as $v){ $content = preg_replace('https://www.jb51.net/'.$v.'\s*=\s*\d+\s*/i', '', $content); $content = preg_replace('https://www.jb51.net/'.$v.'\s*=\s*.+?["\']/i', '', $content); $content = preg_replace('https://www.jb51.net/'.$v.'\s*:\s*\d+\s*px\s*;?/i', '', $content); } return $content; } ?>

演示:

<?php $html = <<<HTML <div> <div> <img src="https://www.jb51.net/images/test.jpg" width=400 height = 200> <div></div> </div> <div> <img src="https://www.jb51.net/images/test.jpg" width=400 height = 200> </div> </div> HTML; echo '<xmp>'; echo '原内容:'.PHP_EOL; echo $html.PHP_EOL.PHP_EOL; echo '过滤后内容:'.PHP_EOL; echo clear_wh($html); echo '</xmp>'; ?>

输出:

原内容: <div> <div> <img src="https://www.jb51.net/images/test.jpg" width=400 height = 200> <div></div> </div> <div> <img src="https://www.jb51.net/images/test.jpg" width=400 height = 200> </div> </div> 过滤后内容: <div > <div> <img src="https://www.jb51.net/images/test.jpg" > <div></div> </div> <div> <img src="https://www.jb51.net/images/test.jpg" > </div> </div>

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:

正则表达式在线生成工具:

更多关于PHP相关内容感兴趣的读者可查看本站专题:《php正则表达式用法总结》、《PHP数组(Array)操作技巧大全》、《PHP基本语法入门教程》、《php字符串(string)用法总结》、《php+mysql数据库操作入门教程》及《php常见数据库操作技巧汇总

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/60498d1dab099e8032244fd07fd2d5a8.html