php5.4后htmlspecialchars输出为空的问题

从旧版进级到php5.4,恐怕最贫苦的就是htmlspecialchars这个问题了!虽然,htmlentities也会受影响,不外,对付中文站来说一般用htmlspecialchars较量常见,htmlentities很是罕用到。

大概老外认为网页普遍应该是utf-8编码的,于是苦了那些用GB2312,GBK编码的中文站......!

详细表示:

$str = "9enjoy.com的php版本是5.2.10";
echo htmlspecialchars($str);

gbk字符集下输出为空...utf-8下,输出正常。

为什么呢,原因在于5.4.0对这个函数的变革:

5.4.0   The default value for the encoding parameter was changed to UTF-8.

本来是什么呢?

string htmlspecialchars ( string $string [, int $flags = ENT_COMPAT | ENT_HTML401 [, string $encoding = 'UTF-8' [, bool $double_encode = true ]]] )

Defines encoding used in conversion. If omitted, the default value for this argument is ISO-8859-1 in versions of PHP prior to 5.4.0, and UTF-8 from PHP 5.4.0 onwards.

本来是ISO-8859-1,5.4后默认酿成utf-8!然后中文利用这个函数就输出为空缺了。

海内一堆开源措施在5.4下城市有这样的问题,DISCUZ官方也发起用户不要进级到5.4。

办理方案:
1.苦逼的修改所有用到htmlspecialchars处所的措施

1.1 其第二个$flags参数,默认是ENT_COMPAT,因此改成
htmlspecialchars($str,ENT_COMPAT,'GB2312');
为什么不是GBK?因为没有GBK这个参数,假如强行利用GBK,则报错给你看:
Warning: htmlspecialchars(): charset `gbk' not supported, assuming utf-8
为了能利用GBK,则改成:
htmlspecialchars($str,ENT_COMPAT,'ISO-8859-1');

1.2.一样是改措施,但可以省略一个参数。
可以在网页头部加
ini_set('default_charset','gbk');
然后改成
htmlspecialchars($str,ENT_COMPAT,'');
文档中有写:An empty string activates detection from script encoding (Zend multibyte), default_charset and current locale (see nl_langinfo() and setlocale()), in this order. Not recommended.
或许意思就是:传入空字符串则利用default_charset的编码

1.3.封装一个函数吧...原来htmlspecialchars这个单词一直欠好记。
function htmlout($str) {
    return htmlspecialchars($str,ENT_COMPAT,'ISO-8859-1');
}
然后去批量替换。

2.直接修改源码,重编译!这也是今朝我在线上做的方案。
修改ext/standard/html.c
或许在372行
/* Default is now UTF-8 */
if (charset_hint == NULL)
return cs_utf_8;
把cs_utf_8改成 cs_8859_1
/* Default is now UTF-8 */
if (charset_hint == NULL)
return cs_8859_1;
编译后,原措施就不消做任何调解了。
安装要领可参考:

windows下怎么办?这个,本身想步伐编译吧,难度较量大...
提供一个网址供参考:
引用其一句话:筹备好咖啡、可乐,做好筹备,大概要折腾数小时…

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/8302.html