前端 - JavaScript如何对后台utf8编码的字符串解码？

Question

为了防止xss以及csrf+xss的漏洞，后台统一对字符串进行了转码
结果如下：
原文： JavaScript高级程序设计
编码： JavaScript高级程序设计

大家讲道理 · Answer

最后总算解决了,&#后面是5个数字，是10进制的= =b 所以不能直接用%替换

function u2str(text){ 
     return $('').html(text).text();
}

这样转回来之后不能防xss漏洞，填入html之前仍然需要转义，不过总算可以和后台交流了。

天蓬老师 · Answer

可以使用原生的Javascript代码来进行转义。该编码其实不是utf8，而是unicode编码。这里的字符实际上是html实体。

var decodeHtmlEntity = function(str) {
  return str.replace(/&#(\d+);/g, function(match, dec) {
    return String.fromCharCode(dec);
  });
};

输入：

var str = 'JavaScript高级程序设计';
console.log(decodeHtmlEntity(str));

输出：
JavaScript高级程序设计

以下代码用于将正常的字符转变为html实体

var encodeHtmlEntity = function(str) {
  var buf = [];
  for (var i=str.length-1;i>=0;i--) {
    buf.unshift(['&#', str[i].charCodeAt(), ';'].join(''));
  }
  return buf.join('');
};

输入：

var str = '高级程序设计';
console.log(encodeHtmlEntity(str));

输出：
高级程序设计

Github gist: https://gist.github.com/4174511

前端 - JavaScript如何对后台utf8编码的字符串解码？

全部回复(2)我来回复