如何防止程序员反编译？_系统运维

Java从诞生以来，其基因就是开放精神，也正因此，其可以得到广泛爱好者的支持和奉献，最终很快发展壮大，以至于有今天之风光！但随着java的应用领域越来越广，特别是一些功能要发布到终端用户手中（如Android开发的app），有时候，公司为了商业技术的保密考虑，不希望这里面的一些核心代码能够被人破解（破解之后，甚至可以被简单改改就发布出去，说严重点，就可能会扰乱公司的正常软件的市场行为），这时候就要求这些java代码不能够被反编译。

这里要先说一下反编译的现象。因为java一直秉持着开放共享的理念，所以大家也都知道，我们一般共享一个自己写的jar包时，同时会共享一个对应的source包。但这些依然与反编译没有什么关系，但java的共享理念，不只是建议我们这样做，而且它自己也在底层上“强迫”我们这么做！在java写的.java文件后，使用javac编译成class文件，在编译的过程，不像C/C++或C#那样编译时进行加密或混淆，它是直接对其进行符号化、标记化的编译处理，于是，也产生了一个逆向工程的问题：可以根据class文件反向解析成原来的java文件！这就是反编译的由来。

但很多时候，有些公司出于如上述的原因考虑时，真的不希望自己写的代码被别人反编译，尤其是那些收费的app或桌面软件（甚至还有一些j2ee的wen项目）！这时候，防止反编译就成了必然！但前面也说过了，因为开放理念的原因，class是可以被反编译的，那现在有这样的需求之后，有哪些方式可以做到防止反编译呢？经过研究java源代码并进行了一些技术实现（结果发现，以前都有人想到过，所以在对应章节的时候，我会贴出一些写得比较细的文章，而我就简单阐述一下，也算偷个懒吧），我总共整理出以下这几种方式：

代码混淆

这种方式的做法正如其名，是把代码打乱，并掺入一些随机或特殊的字符，让代码的可读性大大降低，“曲线救国”似的达到所谓的加密。其实，其本质就是打乱代码的顺序、将各类符号（如类名、方法名、属性名）进行随机或乱命名，使其无意义，让人读代码时很累，进而让人乍一看，以为这些代码是加过密的！

由其实现方式上可知，其实现原理只是扰乱正常的代码可读性，并不是真正的加密，如果一个人的耐心很好，依然可以理出整个程序在做什么，更何况，一个应用中，其核心代码才是人们想去了解的，所以大大缩小了代码阅读的范围！

当然，这种方式的存在，而且还比较流行，其原因在于，基本能防范一些技术人员进行反编译（比如说我，让我破解一个混淆的代码，我宁愿自己重写一个了）！而且其实现较为简单，对项目的代码又无开发上的侵入性。目前业界也有较多这类工具，有商用的，也有免费的，目前比较流行的免费的是：proguard（我现象临时用的就是这个）。

上面说了，这种方式其实并不是真正加密代码，其实代码还是能够被人反编译（有人可能说，使用proguard中的optimize选项，可以从字节流层面更改代码，甚至可以让JD这些反编译软件可以无法得到内容。说得有点道理，但有两个问题：1、使用optimize对JDK及环境要求较高，容易造成混淆后的代码无法正常运行；2、这种方式其实还是混淆，JD反编译有点问题，可以有更强悍的工具，矛盾哲学在哪儿都是存在的^_^）。那如何能做到我的class代码无法被人反编译呢？那就需要我们下面的“加密class”！

加密class

在说加密class之前，我们要先了解一些java的基本概念，如：ClassLoader。做java的人已经或者以后会知道，java程序的运行，是类中的逻辑在JVM中运行，而类又是怎么加载到JVM中的呢（JVM内幕之类的，不在本文中阐述，所以点到为止）？答案是：ClassLoader。JVM在启动时是如何初始化整个环境的，有哪些ClassLoader及作用是什么，大家可以自己问度娘，也不在本文中讨论。

让我们从最常见的代码开始，揭开一下ClassLoader的一点点面纱！看下面的代码：

Java代码

public class Demo{

public static void main(String[] args){

System.out.println(“hello world!”)

}

上面这段代码，大家都认识。但我要问的是：如果我们使用javac对其进行编译，然后使用java使其运行（为什么不在Eclipse中使用Run as功能呢？因为Eclipse帮我们封闭，从而简化了太多东西，使我们忽略了太多的底层细节，只有从原始的 *** 作上，我们才能看到本质），那么，它是怎么加载到JVM中的？答案是：通过AppClassLoader加载的（相关知识点可以参考：http://hxraid.iteye.com/blog/747625）！如果不相信的话，可以输出一下System.out.println(Thread.currentThrea().getContextLoader())看看。

那又有一个新的问题产生了：ClassLoader又是怎样加载class的呢？其实，AppClassLoader继承自java.lang.ClassLoader类，所以，基本 *** 作都在这个类里面，让我们直接看下面这段核心代码吧：

看看这个方法中的逻辑，非常简单，先从内存中找，如果没有，则从父级或根先找，如果没找到，则再从自己的方法里面找！那findClass里面是什么样的呢？很不幸，这个方法是个抽象（abstract）的，也就是使用什么方式加载，由程序使用ClassLoader自己决定！这就给我们留下了巨大的“”！让我们看一下非常常见的一个ClassLoader的实现，那就是URLClassLoader（几乎所有的j2ee的web项目的容器使用的ClassLoader都是继承自它），让我们看一下它的findClass的实现：

这个方法里面的逻辑也很简单，从定义的ucp（就是各个jar包或class文件的具体路径）中读取指定的class文件的信息（如字节流之类），然后交给defineClass定义到JVM中，让我们继续看一下这个方法的核心部分：

看到这里，已经没有必要再往下面看了（再往下就是native方法了，这是一个重大伏笔哦），我们要做的手脚就在这里！

手脚怎么做呢？很简单，上面的代码逻辑告诉我们，ClassLoader只是拿到class文件中的内容byte[]，然后交给JVM初始化！于是我们的逻辑就简单了：只要在交给JVM时是正确的class文件就行了，在这之前是什么样子无所谓！所以，我们的加密的整个逻辑就是：

在编译代码时（如使用ant或maven），使用插件将代码进行加密（加密方式自己选），将class文件里面的内容读取成byte[]，然后进行加密后再写回到class文件（这时候class文件里面的内容不是标准的class，无法被反编译了）

在启动项目代码时，指定使用我们自定义的ClassLoader就行了，而自定义的部分，主要就是在这里做解密工作！

如此，搞定！以上的做法比较完整的阐述，可以仔细阅读一下这篇文章：https://www.ddtsoft.com/#developerworks/cn/java/l-secureclass/文章中的介绍。

通过这个方法貌似可以解决代码反编译的问题了！错！这里有一个巨大的坑！因为我们自定义的ClassLoader是不能加密的，要不然JVM不认识，就全歇菜了！如果我来反编译，呵呵，我只要反编译一下这个自定义的ClassLoader，然后把里面解密后的内容写到指定的文件中保存下来，再把这个加了逻辑的自定义ClassLoader放回去运行，你猜结果会怎样？没错，你会想死！因为你好不容易想出来的加密算法，结果人家根本不需要破解，直接就绕过去了！

现在，让我们总结一下这个方法的优缺点：实现方式简单有效，同时对代码几乎没有侵入性，不影响正常开发与发布。缺点也很明显，就是很容易被人破解！

当然啦，关于缺点问题，你也可以这么干：先对所有代码进行混淆、再进行加密，保证：1、不容易找到我们自定义的那个ClassLoader；2、就算找到了，破解了，代码可读性还是很差，让你看得吐血！（有一篇文章，我觉得写得不错，大家可以看一看：http://www.scjgcj.com/#blog/851544）

嗯，我觉得这个方法很好，我自己也差点被这个想法感动了，但是，作为一个严谨的程序员，我真的不愿意留下一个隐患在这里！所以，我继续思索！

高级加密class

前面我们说过有个伏笔来着，还记得吧？没错，就是那个native！native定义的方法是什么方法？就是我们传说中的JNI调用！前面介绍过的有一篇文章中提到过，其实jvm的真实身份并不是java，而是c++写的jvm.dll（windows版本下），java与dll文件的调用就是通过JNI实现的！于是，我们就可以这样想：JNI可以调用第三方语言的类库，那么，我们可不可以把解密与装载使用第三方语言写（如C++，因为它们生成的库是不好反编译的），这样它可以把解密出来的class内容直接调jvm.dll的加载接口进行初始化成class，再返回给我们的ClassLoader？这样，我们自定义的ClassLoader只要使用JNI调用这个第三方语言写的组件，整个解密过程，都在黑盒中进行，别人就无从破解了！

嗯，这个方法真的很不错的！但也有两个小问题：1.使用第三方语言写，得会第三方语言，我说的会，是指很溜！2.对于不同的 *** 作系统，甚至同一 *** 作系统不同的版本，都可能要有差异化的代码生成对应环境下的组件（如window下是exe，linux是so等）！如果你不在乎这两个问题，我觉得，这个方式真的挺不错的。但对于我来说，我的信条是，越复杂的方式越容易出错！我个人比较崇尚简洁的美，所以，这个方法我不会轻易使用！

对了，如果大家觉得这个方法还算可行的话，可以推荐一个我无意中看到的东西给大家看看（我都没有用过的）：jinstall，

更改JVM

看到这个标题，我想你可能会震惊。是的，你没看错，做为一个程序员，是应该要具有怀疑一切、敢想敢做的信念。如果你有意留心的话，你会发现JVM版本在业界其实也有好几个版本的，如：Sun公司的、IBM的、Apache的、Google的……

所以，不要阻碍自己的想象力，现在没有这个能力，并不代表不可能。所以，我想到，如果我把jvm改了，在里面对加载的类进行解密，那不就可以了吗？我在设计构思过程中，突然发现：人老了就是容易糊涂！前面使用第三方语言实现解密的两个问题，正好也是更改JVM要面对的两个问题，而且还有一个更大的问题：这个JVM就得跟着这个项目到处走啊！

大家都很忙，谁有时间看你的的烂代码！如果真的怕泄露，别用python. 我以前做过这类事情，而且当时更严格，需要打包部署到客户的服务只在有效期内有效，超过有效期必须更新证书才行。 Python代码用任何方法都没法保证保密性，这个时候你可以考虑用一个工具「nuitka」，这个工具会把你的python源代码映射为c++然后编译为二进制，因此对方是无论如何得不到你的源代码的。代价就是nuitka这个工具并不完美，有一些限制并不能100%完美的转换所有python代码。 1.用Cython编译python成 Windows的pyd文件或Linux的so文件，二进制文件相对安全性较高。 2.用源码混淆器把代码搞的又臭又长。。。混淆完了再用Cython编译为二进制。。。这样静态反编译逆向难度也不小。 3.同其他语言程序一样，可以对调试状态进行检测，当处于调试状态时退出程序或进入混乱代码耗费逆向工程人员心神。 4.分享一个跨平台反调试手段，检测函数运行时间，加断点会导致函数运行时间变长，也可感知正在被调试。 Python是提倡开源的，既然选择Python还是拥抱开源才好~ 都开源还担心逆向工程嘛没有不能逆的软件。只要汇编语言过关，逆向工程都是可以实现的，不要有其它想法。你唯一可以做的，就是不让别人用python读取源代码而已。那样实现起来比较简单。 python 适合开发服务器程序，或者自己科研使用的程序，如果是作为用户程序，安装到 pc 或手机上，还是其它 c++ 或java 比较合适 1）可以把需要保护的部分用c语言实现，从而编译成so等文件，这样逆向的成本会比较高，可以防止直接打开python文件看到代码逻辑。 2）so文件通过ida等工具也是可以反汇编的，可以通过对c语言进行代码混淆，花指令等 *** 作，提高通过ida等反汇编工具的分析难度。 3）不存在绝对无法逆向的技术手段，因此只能是看具体需求，选择具体的防逆向的技术手段。有工具类似py2exe转成可执行程序，隐藏全部源代码，虽然bytecode还是可以反编译，但是难度大多了 1. 最稳的就是你改cpython加载代码的过程，改zip包读取最稳。 2. 借助一些加密工具在编译pyc之前进行一定的混淆，可以防君子，自我安慰一下。商用一般都是用第一种办法，小打小闹用第二种。可以考虑使用pymod工具，使用pymod pack 将模块加密打包，发布的时候一个模块就一个文件。先睹为快，看看一个项目发布的时候，只有几个文件， main.py 项目程序入口 setting.py 项目配置 apps 项目模块 plusins 项目插件目录创建项目 pymod create demo1 cd demo1 创建模块 pymod add mod1 启动pycharm 开始编写功能模块一个模块默认由三个文件组成 __init__.py 、 handlers.py 、param_schemas.py 业务逻辑主要在handlers.py中编写 __init__.py from pymod.blueprint import Blueprint api = Blueprint("/mod1") from .handlers import * param_schemas.py schema_sfz = { "type": "object", "required": ["sfz", "nl"], "properties": { "sfz": { "type": "string", "minLength": 18, "maxLength": 18, "description": "身份z明号码" }, "nl": { "type": "integer", "minimum": 0, "maximum": 150, "description": "年龄" } } } handlers.py from . import api from pymod.ext import RequestHandler, params_validate,TrueResponse,FalseResponse from .param_schemas import schema_sfz from pymod.plugins import sfz_check @api.add_route('/hello') class Hello(RequestHandler): def get(self): self.write('Hello World') @params_validate(schema_sfz) def post(self): sfz = self.get_json_arg("sfz") nl =self.get_json_arg("nl") # self.write(TrueResponse(sfz=sfz, nl=nl)) if sfz_check.check_sfzmhm(sfz): self.write(TrueResponse(hint="身份z明号码验证通过")) else: self.write(FalseResponse(hint="身份z明号码验证失败")) 三、项目部署程序调试修改setting.py # 开发模式下运行的模块名称必须填写 modules = ["mod1"] modules_config ={ "mod1": { "deny_ip": "", "allow_ip": "*" } } 启动程序 python main.py 调试没有问题，进入发布模式在项目目录下 pymod pack mod1 在target目录下生成mod1.mod文件，将其复制到apps目录中修改setting.py # 开发模式下运行的模块名称必须填写 modules = [] 再次运行 python main.py 测试一切OK，系统就可以发布了。说不能保密的，是没有研究过python的机制的。我做个一个项目，所有源代码自定义加密，运行时解密。

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/yw/7601872.html

如何防止程序员反编译？

发表评论

评论列表（0条）