PHP过滤html注释 - Yiven

相关文章推荐

含蓄的紫菜汤 · vue-cli · Web软件技术栈随笔 · 看云· 1 年前 ·

朝气蓬勃的洋葱 · 标签条码打印机开发大纲 - Mr.阿拉丁 ...· 2 年前 ·

快乐的麻辣香锅 · Python中子进程Timeout的使用-腾 ...· 2 年前 ·

纯真的鼠标垫 · JavaScript展开运算符和剩余运算符的 ...· 2 年前 ·

至今单身的杨桃 · TypeError: can't ...· 2 年前 ·

过滤html注释:

所谓过滤，不过是字符串的匹配与替换，这里我们用到的正则匹配替换函数preg_replace(reg,replace,string);，PHPer都清楚，这个函数的关键在于reg的精确度，那么我们就来试试看吧：

首先要知道html注释的格式，是这样的：。

开始正则的书写

$html = "<!--something-->something";
$html = preg_replace("/<!--.*-->/","",$html);
echo $html;

上面的代码将输出 something，似乎成功了呢，不急，多测试几个例子

$html = "<!--something-->something<!--something-->";
$html = preg_replace("/<!--.*-->/","",$html);
echo $html;

这个例子告诉我们，这样写并不能达到我们期望的效果，于是正则优化成了这样

preg_replace("/<!--.*？-->/","",$html);

嗯，这下满意了，但是html中会存在这样的代码，这是浏览器兼容代码，显然是不能被过滤的，所以我们的正则继续优化，变成这样

preg_replace("/<!--[^\!\[]*?-->/","",$html);

又接着如果html中有<script></script>的代码，我们又需要改一下我们的匹配规则了，改成了这样

preg_replace("/<!--[^\!\[]*?(?<!\/\/)-->/","",$html);

这样的话我基本上就去掉了我需要去掉的html的注释了！

意外收获：在优化过程中，没有多多行注释进行考虑，但规则意外的正常匹配了多行注释，不知道是否因为是从文件读取的html！

经测试尚未发现有将正文过滤掉的情况，如有疑问，欢迎留言指正。

推荐文章

含蓄的紫菜汤 · vue-cli · Web软件技术栈随笔 · 看云

1 年前

朝气蓬勃的洋葱 · 标签条码打印机开发大纲 - Mr.阿拉丁 - 博客园

2 年前

快乐的麻辣香锅 · Python中子进程Timeout的使用-腾讯云开发者社区-腾讯云

2 年前

纯真的鼠标垫 · JavaScript展开运算符和剩余运算符的区别 - Jaxu - 博客园

2 年前

至今单身的杨桃 · TypeError: can't pickle Transaction objects 解决_cannot pickle 'tensor' object_wwlhz的博客-CSDN博客

2 年前