首页  >  问答  >  正文

前端 - JavaScript如何对后台utf8编码的字符串解码?

为了防止xss以及csrf+xss的漏洞,后台统一对字符串进行了转码
结果如下:
原文: JavaScript高级程序设计
编码: JavaScript高级程序设计

前端写了一段如下代码:

function u2str(text){ // transform text in utf8 format to string
	return unescape(text.replace(/&#/g,'%u').replace(/;/g,''));
}

对普通的中文没问题,但是对上面的中英文加载的文本,这个函数就会返回乱码。
这种&#打头的utf8文本该怎么显示呀?

天蓬老师天蓬老师2771 天前1506

全部回复(2)我来回复

  • 大家讲道理

    大家讲道理2017-04-10 12:44:06

    最后总算解决了,&#后面是5个数字,是10进制的= =b 所以不能直接用%替换

    function u2str(text){ 
         return $('<p></p>').html(text).text();
    }

    这样转回来之后不能防xss漏洞,填入html之前仍然需要转义,不过总算可以和后台交流了。

    回复
    0
  • 天蓬老师

    天蓬老师2017-04-10 12:44:06

    可以使用原生的Javascript代码来进行转义。该编码其实不是utf8,而是unicode编码。这里的字符实际上是html实体。

    var decodeHtmlEntity = function(str) {
      return str.replace(/&#(\d+);/g, function(match, dec) {
        return String.fromCharCode(dec);
      });
    };

    输入:

    var str = 'JavaScript&#39640;&#32423;&#31243;&#24207;&#35774;&#35745;';
    console.log(decodeHtmlEntity(str));

    输出:
    JavaScript高级程序设计

    以下代码用于将正常的字符转变为html实体

    var encodeHtmlEntity = function(str) {
      var buf = [];
      for (var i=str.length-1;i>=0;i--) {
        buf.unshift(['&#', str[i].charCodeAt(), ';'].join(''));
      }
      return buf.join('');
    };

    输入:

    var str = '高级程序设计';
    console.log(encodeHtmlEntity(str));

    输出:
    &#39640;&#32423;&#31243;&#24207;&#35774;&#35745;

    Github gist: https://gist.github.com/4174511

    回复
    0
  • 取消回复