共计 2889 个字符,预计需要花费 8 分钟才能阅读完成。
download: 深度分析 C 语言常识体系 原理 + 实际,一课带你吃透 C 语言
结构字符串
你会常常需要打印字符串。要是有很多变量,防止上面这样:
name = “Raymond”
age = 22
born_in = “Oakland, CA”
string = “Hello my name is ” + name + “and I’m ” + str(age) + ” years old. I was born in ” + born_in + “.”
print(string)
额,这看起来多乱呀?你能够用个丑陋简洁的办法来代替,.format。
这样做:
前言
去年 11 月在 PyCon China 2018 杭州站分享了,讲述了如何通过修改 Python 解释器达到加解密 Python 代码的目标。然而因为笔者迁延症发生,一直没有及时整顿成文字版,现在终于战胜了它,才有了本文。
本文将首先介绍下现有源码加密打算的思路、方法、长处与不足,进而介绍如何通过定制 Python 解释器来达到更好地加解密源码的目标。
现有加密打算
因为 Python 的动静个性和开源个性,导致 Python 代码很难做到很好的加密。社区中的一些声音认为这样的限度是事实,应该通过法律手段而不是加密源码达到商业保护的目标;而还有一些声音则是不论如何都心愿能有一种手段来加密。于是乎,人们想出了各种或加密、或混淆的打算,借此来达到保护源码的目标。
常见的源码保护手段有如下几种:
发行 .pyc 文件
代码混淆
使用 py2exe
使用 Cython
上面来简略说说这些打算。
发行 .pyc 文件
思路
大家都知道,Python 解释器在执行代码的过程中会首先生成 .pyc 文件,而后解释执行 .pyc 文件中的内容。当然了,Python 解释器也能够间接执行 .pyc 文件。而 .pyc 文件是二进制文件,无奈间接看出源码内容。如果发行代码到客户环境时都是 .pyc 而非 .py 文件的话,那岂不是能达到保护 Python 代码的目标?
方法
把 .py 文件编译为 .pyc 文件,是件非常轻松地事件,可不需要把所有代码跑一遍,而后去捞生成的 .pyc 文件。
事实上,Python 标准库中提供了一个名为 的库,可能轻松地进行编译。
执行如下命令能够将遍历 目录下的所有 .py 文件,将之编译为 .pyc 文件:
python -m compileall
而后删除 目录下所有 .py 文件就可能打包公布了:
$ find -name ‘*.py’ -type f -print -exec rm {} \;
长处
简单方便,提高了一点源码破解门槛
平台兼容性好,.py 能在哪里运行,.pyc 就能在哪里运行
不足
解释器兼容性差,.pyc 只能在特定版本的解释器上运行
有现成的反编译工具,破解成本低
就是这样一款反编译工具,成果出众。
执行如下命令,即可将 .pyc 文件反编译为 .py 文件:
$ uncompyle6 compiled-python-file-pyc-or-pyo
代码混淆
如果代码被混淆到肯定程度,轮作者看着都费劲的话,是不是也能达到保护源码的目标呢?
思路
既然咱们的目标是混淆,就是通过一系列的转换,让代码逐渐不那么让人容易明确,那就可能这样下手:
移除正文和文档。没有这些说明,在一些要害逻辑上就没那么容易明确了。
改变缩进。圆满的缩进看着才舒服,如果缩进忽长忽短,看着也肯定闹心。
在 tokens 两头加入肯定空格。这就和改变缩进的成果差不多。
重命名函数、类、变量。命名间接影响了可读性,乱七八糟的名字可是浏览理解的一大阻碍。
在空白行插入有效代码。这就是障眼法,用无关代码来打乱浏览节奏。
方法
方法一:使用 oxyry 进行混淆
是一个在线混淆 Python 代码的网站,使用它可能便当地进行混淆。
假设咱们有这样一段 Python 代码,涉及到了类、函数、参数等内容:
coding: utf-8
class A(object):
"""Description"""
def __init__(self, x, y, default=None):
self.z = x + y
self.default = default
def name(self):
return 'No Name'
def always():
return True
num = 1
a = A(num, 999, 100)
a.name()
always()
通过 Oxyry 的混淆,失去如下代码:
class A (object):#line:4
""#line:7
def __init__ (O0O0O0OO00OO000O0 ,OO0O0OOOO0000O0OO ,OO0OO00O00OO00OOO ,OO000OOO0O000OOO0 =None):#line:9
O0O0O0OO00OO000O0 .z =OO0O0OOOO0000O0OO +OO0OO00O00OO00OOO #line:10
O0O0O0OO00OO000O0 .default =OO000OOO0O000OOO0 #line:11
def name (O000O0O0O00O0O0OO):#line:13
return 'No Name'#line:14
def always ():#line:17
return True #line:18
num =1 #line:21
a =A (num ,999 ,100)#line:22
a .name ()#line:23
always ()
混淆后的代码次要在正文、参数名称和空格上做了些调整,稍微带来了点浏览上的阻碍。
方法二:使用 pyobfuscate 库进行混淆
算是一个颇具年头的 Python 代码混淆库了,但却是“老当益壮”了。
对上述同样一段 Python 代码,经 pyobfuscate 混淆后成果如下:
coding: utf-8
if 64 – 64: i11iIiiIii
if 65 – 65: O0 / iIii1I11I1II1 % OoooooooOO – i1IIi
class o0OO00 (object) :
if 78 – 78: i11i . oOooOoO0Oo0O
if 10 – 10: IIiI1I11i11
if 54 – 54: i11iIi1 – oOo0O0Ooo
if 2 – 2: o0 i1 ii1IiI1i % OOooOOo / I11i / Ii1I
def init (self , x , y , default = None) :
self . z = x + y
self . default = default
if 48 – 48: iII111i % IiII + I1Ii111 / ooOoO0o * Ii1I
def name (self) :
return ‘No Name’
if 46 – 46: ooOoO0o * I11i – OoooooooOO
if 30 – 30: o0 – O0 % o0 – OoooooooOO O0 OoooooooOO
def Oo0o () :
return True
if 60 – 60: i1 + I1Ii111 – I11i / i1IIi
if 40 – 40: oOooOoO0Oo0O / O0 % ooOoO0o + O0 * i1IIi
I1Ii11I1Ii1i = 1
Ooo = o0OO00 (I1Ii11I1Ii1i , 999 , 100)
Ooo . name ()
Oo0o () # dd678faae9ac167bc83abf78e5cb2f3f0688d3a3
相比于方法一,方法二的成果看起来更好些。除了类和函数进行了重命名、加入了一些空格,最显著的是插入了若干段无关的代码,变得更加难读了。