Rumah >hujung hadapan web >tutorial js >代码压缩混淆加密的实例详解

代码压缩混淆加密的实例详解

零下一度asal: 2017-07-17 14:39:364938semak imbas

一直有人问HTML加密混淆怎么做，其实这在业内是早已很多人研究过的课题。
假日期间整理一篇文章分享给大家。

我们先理下需求，加密的目的是什么？加密到什么级别？为此我们可以牺牲什么？我们知道这个世界不存在绝对的安全，加密会被破解、混淆会被反混淆。技术小白、开发者、黑客，是完不同的级别，防范不同级别的人策略都不一样。防范力度越大，投入代价也越大，比如聘请专业的安全公司。除了投入，我们还需要考虑程序的执行性能和用户体验。加密的代码在运行时必须解密，混淆后尤其是混淆HTML后，程序的执行性能会下降。是否真的有必要做这类的源码保护，还需要谨慎取舍。一般而言，前端的代码，负责的是用户体验，后端的代码，负责更安全的数据处理。前端不要涉及泄漏太多涉密信息，那么加密的意义不是特别大。

我很少在前端代码里看到值得保护的内容，比如高深的算法，很多代码是没必要牺牲用户体验来保护的。但有些前端代码涉及最终用户的数据安全，此时还是要努力做数据保护的。

1. 降低可读性

1.1 压缩（compression）

很好理解，就是去掉注释、多于的空格、简化标识符等等。工具很多，YUI Compressor、UglifyJS、Google Closure Compiler等等。

1.2 混淆（obfuscation）

保证不破坏代码执行结果的情况下，让代码变得难以阅读。常用混淆规则：拆分字符串、拆分数组、增加废代码、，压缩其实也有一定混淆功能。本质就是改变输入代码字符串的抽象语法树（AST）的结构。其他工具：v8就是一个，还有mozilla的SpiderMonkey, 知名的esprima，还有uglify；商业混淆服务有：jscramble。

1.3 加密（encryption）

这里的加密指文本可逆编码，是狭义的加密，也就是我们常说的加密啦。这个部分依然是借助一些工具，如： Packer 、bcrypt等等。

2. 代码不放置在JS文件中

将代码放在非js文件中，增加定位难度。这里常用的方式有两种：放置到png中，通过HTML Canvas 2D Context获取二进制数据的特性，可以用图片来存储脚本资源；放置到css文件中，利用content样式可以存放字符串的特性，同样可以。

2.1 png

用png保存js代码，首先需要对png进行编码，然后使用的时候进行解码。借助canvas及base64和二进制编码。

编码

1、字符串转换成ascii码；
2、创建足够存储空间的canvas；
3、将字符填入到像素中（忽略alpha值）；
4、获取data url；
canvas.toDataURL(“image/png”);
5、存为png图片。

function encodeUTF8(str) {  return String(str).replace(  /[\u0080-\u07ff]/g,  function(c) {  let cc = c.charCodeAt(0);return String.fromCharCode(0xc0 | cc >> 6, 0x80 | cc & 0x3f);
        }
    ).replace(  /[\u0800-\uffff]/g,  function(c) {  let cc = c.charCodeAt(0);return String.fromCharCode(0xe0 | cc >> 12, 0x80 | cc >> 6 & 0x3f, 0x80 | cc & 0x3f);
        }
    );
}function request(url, loaded) {  let xmlhttp = new XMLHttpRequest();
    xmlhttp.onreadystatechange = function() {  if (xmlhttp.readyState == 4)  if (xmlhttp.status == 200)  
                loaded(xmlhttp);
    }
    xmlhttp.open("GET", url, true);
    xmlhttp.send();
}void function(){  let source = &#39;../image/test.js&#39;;
    request(source, function(xmlhttp){let text = encodeUTF8(xmlhttp.responseText);let pixel = Math.ceil((text.length + 2) / 3); // 1一个像素存3个字节,  let size = Math.ceil(Math.sqrt(pixel));//console.log([text.length, pixel, size, size * size * 3]);let canvas = document.createElement(&#39;canvas&#39;);
        canvas.width = canvas.height = size;let context = canvas.getContext("2d"),  
            imageData = context.getImageData(0, 0, canvas.width, canvas.height),  
            pixels = imageData.data;for(let i = 0, j = 0, l = pixels.length; i < l; i++){  if (i % 4 == 3) { // alpha会影响png还原
                pixels[i] = 255;continue;
            }let code = text.charCodeAt(j++);if (isNaN(code)) break;
            pixels[i] = code;
        }
        context.putImageData(imageData, 0, 0);
        document.getElementById(&#39;base64&#39;).src = canvas.toDataURL("image/png");
    });
}();

编码后的图片：
这里写图片描述

解码

1、加载png；
2、将png原尺寸绘制到canvas中；
3、读取像素中的字符串；
4、生成相应协议的data url使用。

void function(){  let source = &#39;../image/test.png&#39;;let img = document.createElement(&#39;img&#39;);
    img.onload = function(){  let canvas = document.createElement(&#39;canvas&#39;);
        canvas.width = img.width;
        canvas.height = img.height;let context = canvas.getContext("2d");
        context.drawImage(img, 0, 0);let imageData = context.getImageData(0, 0, canvas.width, canvas.height),  
            pixels = imageData.data;let script = document.createElement(&#39;script&#39;);let buffer = [];for (let i = 0, l = pixels.length; i < l; i++) {  if (i % 4 == 3) continue; // alpha会影响png还原  if (!pixels[i]) break;
            buffer.push(String.fromCharCode(pixels[i]));
        }
        script.src = &#39;data:text/javascript;charset=utf-8,&#39; + encodeURIComponent(buffer.join(&#39;&#39;));
        document.body.appendChild(script);
        script.onload = function(){  
            console.log(&#39;script is loaded!&#39;);
        }
        img = null;
    }
    img.src = source;
}();

这里需要手动下载编码后的图片，我没有写自动下载的函数，这又是另一个可以深入探讨的问题了，所以不过多扩展。

2.2 css

使用content就简单多啦。

let div = document.getElementById(&#39;content&#39;);let content = window.getComputedStyle(div, &#39;:before&#39;).content;

只需要和上面代码一样，新建一个srcript标签，利用data协议，就可以执行content内保存的js代码啦。

3. 防止代码执行被截获

截获 eval() / new Function() 的示例代码

eval = function() {
  console.log(&#39;eval&#39;, JSON.stringify(arguments));
};eval(&#39;console.log("Hello world!")&#39;);Function = function() {
  console.log(&#39;Function&#39;, JSON.stringify(arguments));  return function() {};
};new Function(&#39;console.log("Hello world!")&#39;)();

但是可能不是全局使用：

(function(){}).constructor(&#39;console.log("Hello world!")&#39;)()

截获 constructor 的示例代码

Function.prototype.__defineGetter__(&#39;constructor&#39;, function () {return function () {
        console.log(&#39;constructor&#39;, JSON.stringify(arguments));
    };
});
(function() {}).constructor(&#39;console.log("Hello world!")&#39;);

目前能想到的是判断 eval 是否被重定向

示例，如果 eval 被重定向 z 变量不会被泄露

<span style="font-size: 18px"><code class="language-js hljs  has-numbering">(<span class="hljs-function">function<span class="hljs-params">(x){<span class="hljs-keyword">var z = <span class="hljs-string">&#39;console.log("Hello world!")&#39;;<span class="hljs-built_in">eval(<span class="hljs-string">&#39;function x(){eval(z)}&#39;);
    x();
})(<span class="hljs-function">function<span class="hljs-params">() { <span class="hljs-comment">/* ... */ });<br/><br/><span style="font-size: 18pt; background-color: #ff0000"><strong>uglify介绍<br/></strong></span></span></span></span></span></span></span></span></span></span></code></span>

概述：

<br/>

案例：Cesium打包流程，相关技术点和大概流程
原理：代码优化的意义：压缩优化混淆
优化：如何完善Cesium打包流程

<br/>

关键字：Cesium gulp uglifyjs

<br/>

字数：2330 | 阅读时间：7min+

<br/>

<br/>

1 Cesium打包流程

<br/>

如果没有记错，Cesium从2016年初对代码构建工具做了一次调整，从grunt改为gulp。作为一名业余选手，就不揣测两者的差别了。个人而言，gulp和Ant的思路很相似，通过管道连接，都是基于流的构建风格，而且gulp更像是JS的编码风格，自带一种亲切感。

<br/>

gulp.task('task1',['task0'], function() {

return fun_task1();

});

<br/>

Task语句是gulp中最常见的，懂了这句话，就等于你看懂脚本了。这句话的意思是，要执行task1，需要先执行task0，而task1的具体工作都在fun_task1方法中。这就是之前说的基于流的构建风格。有了这句话，在命令行中键入：gulp task1，回车执行该指令即可。

<br/>

先安装Node，环境变量等，并安装npm包后，即可使用gulp打包工具，这里推荐cnpm。环境搭建好后，命令行中键入gulp minify开始打包。完整的过程是build->generateStubs->minify。

<br/>

1gulp

<br/>

Cesium打包流程

<br/>

build：准备工作，创建Build文件夹；将glsl文件转为js形式；最主要的是createCesiumJs方法，遍历Source中所有js脚本，将所有Object记录到Source/Cesium.js；其他的是范例，单元测试相关模块。

<br/>

generateStubs：用于单元测试，略。

<br/>

minify; 首先combineJavaScript主要做了两件事情，打包Cesium和Workers脚本，这是打包的最终结果。Gulp根据指令的不同，比如minify下采用uglify2优化，而combine对应的参数为none，生成路径为CesiumUnminified。

<br/>

另外，细心的人会发现，combineCesium的实现中有这样一句话path.relative('Source',require.resolve('almond'))，这是一个小优化，almond是requirejs的精简包，因此，最终的Cesium.js中包含'almond脚本，内置了requirejs的主要方法。

<br/>

如上是Cesium打包的主要流程，简单说主要有3+1类个指令：

<br/>

Clean

清空文件

minify

打包&压缩

combine

只打包，不压缩

JScoverage

单元测试覆盖率，不了解

<br/>

2 代码优化

<br/>

对流程有了一个大概了解，下面，我们详细了解一下uglify2过程都做了哪些代码优化，一言以蔽之，压缩，优化，混淆。

<br/>

uglify2主要有三个参数：-o，-c，-m，-o参数必选，指定输出文件，-c压缩，-m混淆变量名。如下分别为combine、(uglifyjs -o)、(uglifyjs –c -m -o)的文件对比，单位是k：

<br/>

2file

<br/>

uglify2的压缩对比

<br/>

都在一个屋檐下，差距怎么就这么大呢？我们简单说一下从1~2，2~3之间青取之于蓝而胜于蓝的过程。

<br/>

1~2的过程其实很简单，就是干了三件事，去掉注释，去掉多余的空格(换行符)，去掉不必要的分号(;)。就这三件事情，文件一下子小了一半多，换句话就是平时你写的代码有一大半都是废话，此时你旁边的AI程序员可能会喃喃道来“你们人类好愚蠢~”。

<br/>

2~3则是很多小细节的综合应用：

<br/>

去掉一些实际没有调用的函数（Dead code）；
将零散的变量声明合并，比如 var a; var b;变为var a,b;
逻辑函数的精简，比如if(a) b(); else c()变为a ? b() : c();
变量名的简化，比如var strObject;变为var s;
……

<br/>

这些小技巧有很多，具体要看不同的压缩工具的考虑优劣，但有些压缩高效的工具并不稳定，可能会破坏语法规范或语意，所以没必要为了几个kb承担过多的风险，目前比较成熟的工具主要有三个uglify2，google closure以及yuicompressor，具体优劣得自己来体会了，我是按照自己的理解给出的先后顺序。最终的效果如下：

<br/>

3uglifyresult

<br/>

Cesium脚本效果

<br/>

这样的代码只能用单位“坨”来形容了，人类是无法直接读懂的，那浏览器能读懂吗？这是一个好问题！如下是V8引擎对JS语法解析的大概流程：

<br/>

4parser

<br/>

V8引擎解析JS脚本

<br/>

下面是在我本机Chrome解析Cesium.js脚本花费时间（脚本从下载完到浏览器解析完的时间差），单位毫秒，因为只测试了一次，可能会有误差，但基本吻合期望值：

<br/>

5parser

<br/>

JS脚本解析时间对比

<br/>

首先因为是本机测试，脚本无论是最大的8M还是最小的2.4M，下载速度都很快，因此我们不讨论（但实际应用中要考虑）脚本下载所需时间。

<br/>

其次，如上图，多了一个source，这是源码情况下，这个时间水分比较大，因为是零散的文件，可以做到按需下载，但因为文件比较琐碎，性能也不高。

<br/>

结论是，这种JS脚本优化策略对浏览器的影响不大，浏览器看到优化后的代码，可能会愣一会神，但很快就克服了。

<br/>

3实战

<br/>

知道了代码优化的大概原理，回顾一下代码优化的目的（压缩，优化，混淆），匹配一下结果是否符合期望值。嗯，其一，脚本的大小小了，其二，代码效率也优化了，其三，别人也看不懂了。似乎该做的都已经做了，这个脚本已经很完美了。

<br/>

6format

<br/>

Format后的效果

<br/>

毛爷爷说，与人斗其乐无穷。确实，前两点的目的达到了，但第三点，还差很多。如上，和刚才的脚本是同一个文件，我只是用Chrome的调试工具format而已。这就是理想和现实之间的差距。

<br/>

可见，Cesium默认打包工具在压缩和优化上都没有问题，但在混淆上并不充分，当然Cesium本身是开源的，也没必要搞这些。客观说，JS脚本是明码的，所以反编译只是时间和能力的问题，所以不妨换个态度来看待这个问题，增加反编译的成本，当该成本大于购买成本即可

 <br/>

Atas ialah kandungan terperinci 代码压缩混淆加密的实例详解. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：Chrome DevTools常用功能的实例教程Artikel seterusnya：js学习正则之replace的实例详解

Artikel berkaitan

Lihat lagi