PyInstaller打包、解包与反编译.pyc文件

PyInstaller打包、解包与反编译.pyc文件,第1张

PyInstaller官网: >

具体步骤如下:

#! /bin/sh

set -x

#

# 一般gzip压缩包的magic值为0x8b1f后跟0x0008,或者0x0808。

# 这里就是要找出这个偏移。

# 119116,就是这个偏移,这个偏移在不同的bzImage里是不同的,所以,这里需要手动调整一下。

# 解压后的文件即vmlinuxbin

od -h -A d bzImage | grep --color -m 3 -A 1 -i 8b1f

dd if=bzImage bs=1 skip=11916 | gunzip > vmlinuxbin

# 调用我写的一个python脚本,生成gnu linker script。

/genldspy > vmlinuxelflds

# 构造 ELF 信息,结果文件为vmlinuxelf

ld -m elf_x86_64 --format binary --oformat elf64-x86-64 -T vmlinuxelflds vmlinuxbin -o vmlinuxelf

# 如果是32位系统,可以用以下命令

#ld -m elf_i386 --format binary --oformat elf32-i386 -T vmlinuxelflds vmlinuxbin -o vmlinuxelf

# 删除在上一步生成的多余符号。

objcopy --strip-symbol _binary_vmlinux_bin_start --strip-symbol _binary_vmlinux_bin_end --strip-symbol _binary_vmlinux_bin_size vmlinuxelf

# 设置 text section标志,否则objdump -d不能正常工作,只能用objdump -D。

objcopy --set-section-flag text=alloc,readonly,code vmlinuxelf

# 以后只是出于验证目的。

# 以schedule函数作为一个样本,检查在vmlinuxelf文件里是不是包括了正确的偏移。

grep --color "[tT] schedule$" Systemmap

readelf -s vmlinuxelf | grep " schedule$" --color

genldspy内容如下:

#! /usr/bin/python

import sys

#将 形如 fffffff8989 的字符串转换为数字形式。

def to_no(hexstr):

ret = 0

start = -1

len_hexstr = len(hexstr)

while start>=-len_hexstr:

c = hexstr[start]

if c in "0123456789":

n = ord(c) - ord('0')

elif c in "abcdef":

n = ord(c) - ord('a') + 0xa

elif c in "ABCDEF":

n = ord(c) - ord('A') + 0xa

ret |= long(n<<((-start-1)4))

start -= 1

return ret

# 计算addr-base

def sym_offset(addr, base):

if base == "missing-base":

return "missing-offset"

addr = to_no(addr)

base = to_no(base)

return hex(int(addr-base))

lines = file("Systemmap")readlines()

result=""

# 求text的开始地址

base="missing-base"

for line in lines:

line = linestrip()

addr, type, sym = linesplit(" ")

if type in "tT":

if sym in ("startup_64", "startup_32"):

base = addr

break

# 生成lds中的符号行。

for line in lines:

line = linestrip()

addr, type, sym = linesplit(" ")

if type in "tT":

offset = sym_offset(addr, base)

result+="\t%s = %s; / orig: 0x%s /\n" % (sym, offset, addr)

# 生成需要的脚本

template="""

OUTPUT_FORMAT("elf64-x86-64", "elf64-x86-64", "elf64-x86-64")

OUTPUT_ARCH(i386:x86-64)

SECTIONS

{

= 0x%s;

text : {

(data)

%s}

}

"""

print template % (base, result)

以下是反汇编的出来部分结果:

ffffffff80466ca0 <interruptible_sleep_on>:

ffffffff80466ca0: 55 push %rbp

ffffffff80466ca1: 48 ba ff ff ff ff ff mov $0x7fffffffffffffff,%rdx

ffffffff80466ca8: ff ff 7f

ffffffff80466cab: be 01 00 00 00 mov $0x1,%esi

ffffffff80466cb0: 48 89 e5 mov %rsp,%rbp

ffffffff80466cb3: c9 leaveq

ffffffff80466cb4: e9 c7 fe ff ff jmpq ffffffff80466b80 <__sched_text_start>

ffffffff80466cb9: 0f 1f 80 00 00 00 00 nopl 0x0(%rax)

ffffffff80466cc0 <schedule>:

ffffffff80466cc0: 55 push %rbp

ffffffff80466cc1: 48 c7 c0 80 ef 62 80 mov $0xffffffff8062ef80,%rax

ffffffff80466cc8: 48 c7 c2 00 b4 62 80 mov $0xffffffff8062b400,%rdx

ffffffff80466ccf: 48 89 e5 mov %rsp,%rbp

ffffffff80466cd2: 41 57 push %r15

ffffffff80466cd4: 41 56 push %r14

ffffffff80466cd6: 41 55 push %r13

ffffffff80466cd8: 41 54 push %r12

ffffffff80466cda: 53 push %rbx

ffffffff80466cdb: 48 81 ec 98 00 00 00 sub $0x98,%rsp

ffffffff80466ce2: 48 c7 85 78 ff ff ff movq $0xffffffff8062ef80,-0x88(%rbp)

ffffffff80466ce9: 80 ef 62 80

pre{overflow-x: auto}

Python 是世界上使用最广泛的编程语言之一。它是一种解释型高级通用编程语言,具有广泛的用途,几乎可以将其用于所有事物。其以简单的语法、优雅的代码和丰富的第三方库而闻名。python除了有很多优点外,但在速度上还有一个非常大的缺点。

虽然Python代码运行缓慢,但可以通过下面分享的5个小技巧提升Python运行速度!

首先,定义一个计时函数timeshow,通过简单的装饰,可以打印指定函数的运行时间。

这个函数在下面的例子中会被多次使用。

def timeshow(func):     from time import time     def newfunc(arg, kw):         t1 = time()         res = func(arg, kw)         t2 = time()         print(f"{func__name__: >10} : {t2-t1:6f} sec")         return res     return newfunc @timeshow def test_it():     print("hello pytip") test_it() 1 选择合适的数据结构

使用正确的数据结构对python脚本的运行时间有显着影响。Python 有四种内置的数据结构:

列表 : List

元组 : Tuple

集合 : Set

字典 : Dictionary

但是,大多数开发人员在所有情况下都使用列表。这是不正确的做法,应该根据任务使用合适数据结构。

运行下面的代码,可以看到元组执行简单检索 *** 作的速度比列表快。其中dis模块反汇编了一个函数的字节码,这有利于查看列表和元组之间的区别。

import dis def a():     data = [1, 2, 3, 4, 5,6,7,8,9,10]     x =data[5]     return x def b():     data = (1, 2, 3, 4, 5,6,7,8,9,10)     x =data[5]     return x print("-----:使用列表的机器码:------") disdis(a) print("-----:使用元组的机器码:------") disdis(b)

运行输出:

-----:使用列表的机器码:------

3 0 LOAD_CONST 1 (1)

2 LOAD_CONST 2 (2)

4 LOAD_CONST 3 (3)

6 LOAD_CONST 4 (4)

8 LOAD_CONST 5 (5)

10 LOAD_CONST 6 (6)

12 LOAD_CONST 7 (7)

14 LOAD_CONST 8 (8)

16 LOAD_CONST 9 (9)

18 LOAD_CONST 10 (10)

20 BUILD_LIST 10

22 STORE_FAST 0 (data)

4 24 LOAD_FAST 0 (data)

26 LOAD_CONST 5 (5)

28 BINARY_SUBSCR

30 STORE_FAST 1 (x)

5 32 LOAD_FAST 1 (x)

34 RETURN_VALUE

-----:使用元组的机器码:------

7 0 LOAD_CONST 1 ((1, 2, 3, 4, 5, 6, 7, 8, 9, 10))

2 STORE_FAST 0 (data)

8 4 LOAD_FAST 0 (data)

6 LOAD_CONST 2 (5)

8 BINARY_SUBSCR

10 STORE_FAST 1 (x)

9 12 LOAD_FAST 1 (x)

14 RETURN_VALUE

看下列表的机器码,冗长而多余!

2 善用强大的内置函数和第三方库

如果你正在使用python并且仍在自己编写一些通用函数(比如加法、减法),那么是在侮辱python。 Python有大量的库和内置函数来帮助你不用编写这些函数。 如果研究下,那么你会惊奇地发现几乎90%的问题已经有第三方包或内置函数来解决。

可以通过访问官方文档查看所有内置函数。你也可以在wiki python上找到更多使用内置函数的场景。

比如,现在我们想合并列表中的所有单词为一个句子,比较法自己编写和调用库函数的区别:

# ❌ 正常人能想到的方法 @timeshow def f1(list):     s =""     for substring in list:         s += substring     return s # ✅ pythonic 的方法 @timeshow def f2(list):     s = ""join(list)     return s l = ["I", "Love", "Python"]  1000 # 为了看到差异,我们把这个列表放大了 f1(l) f2(l)

运行输出:

f1 : 0000227 sec

f2 : 0000031 sec

3 少用循环

用 列表推导式 代替循环

用 迭代器 代替循环

用 filter() 代替循环

减少循环次数,精确控制,不浪费CPU

## 返回n以内的可以被7整除的所有数字。 # ❌ 正常人能想到的方法: @timeshow def f_loop(n):      L=[]     for i in range(n):         if i % 7 ==0:             Lappend(i)     return L #  ✅ 列表推导式 @timeshow def f_list(n):     L = [i for i in range(n) if i % 7 == 0]     return L # ✅  迭代器 @timeshow def f_iter(n):     L = (i for i in range(n) if i % 7 == 0)     return L # ✅ 过滤器  @timeshow def f_filter(n):     L = filter(lambda x: x % 7 == 0, range(n))     return L # ✅ 精确控制循环次数  @timeshow def f_mind(n):     L = (i7 for i in range(n//7))     return L n = 1_000_000 f_loop(n) f_list(n) f_iter(n) f_filter(n) f_mind(n)

输出为:

f_loop : 0083017 sec

f_list : 0056110 sec

f_iter : 0000015 sec

f_filter : 0000003 sec

f_mind : 0000002 sec

谁快谁慢,一眼便知!

filter 配合 lambda 大法就是屌!!!

4 避免循环重复计算

如果你有一个迭代器,必须用它的元素做一些耗时计算,比如匹配正则表达式。你应该将正则表达式模式定义在循环之外,因为最好只编译一次模式,而不是在循环的每次迭代中一次又一次地编译它。

只要有可能,就应该尝试在循环外进行尽可能多的运算,比如将函数计算分配给局部变量,然后在函数中使用它。

# ❌ 应改避免的方式: @timeshow def f_more(s):     import re     for i in s:         m = research(r'a[a-z]c', i) # ✅ 更好的方式: @timeshow def f_less(s):     import re     regex = recompile(r'a[a-z]c')     for i in s:         m = regexsearch(i) s = ["abctestabc"]  1_000 f_more(s) f_less(s)

输出为:

f_more : 0001068 sec

f_less : 0000365 sec

5 少用内存、少用全局变量

内存占用是指程序运行时使用的内存量。为了让Python代码运行得更快,应该减少程序的内存使用量,即尽量减少变量或对象的数量。

Python 访问局部变量比全局变量更有效。在有必要之前,应该始终尝试忽略声明全局变量。一个在程序中定义过的全局变量会一直存在,直到整个程序编译完成,所以它一直占据着内存空间。另一方面,局部变量访问更快,且函数完成后即可回收。因此,使用多个局部变量比使用全局变量会更好。

# ❌ 应该避免的方式: message = "Line1\n" message += "Line2\n" message += "Line3\n" # ✅ 更好的方式: l = ["Line1","Line2","Line3"] message = '\n'join(l) # ❌ 应该避免的方式: x = 5 y = 6  def add():     return x+y add() # ✅ 更好的方式: def add():     x = 5     y = 6     return x+y add()

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注的更多内容!

python的编译后文件pyc,可以将pyc文件反编译为py文件。

相应的工具: uncompyle

github地址: >

与两个变量的赋值方法一样。

1、交换两个变量可以简单的使用A, B = B, A的语句来完成。2、查看该函数的反汇编,可以看到python首先载入三个值,依次执行了ROT_THREE和ROT_TWO指令。3、函数的返回值可以是多个值。可以直接将函数返回值赋值给多个变量。

Python常用库大全,看看有没有你需要的。

环境管理

管理 Python 版本和环境的工具

p – 非常简单的交互式 python 版本管理工具。

pyenv – 简单的 Python 版本管理工具。

Vex – 可以在虚拟环境中执行命令。

virtualenv – 创建独立 Python 环境的工具。

virtualenvwrapper- virtualenv 的一组扩展。

包管理

管理包和依赖的工具。

pip – Python 包和依赖关系管理工具。

pip-tools – 保证 Python 包依赖关系更新的一组工具。

conda – 跨平台,Python 二进制包管理工具。

Curdling – 管理 Python 包的命令行工具。

wheel – Python 分发的新标准,意在取代 eggs。

包仓库

本地 PyPI 仓库服务和代理。

warehouse – 下一代 PyPI。

Warehousebandersnatch – PyPA 提供的 PyPI 镜像工具。

devpi – PyPI 服务和打包/测试/分发工具。

localshop – 本地 PyPI 服务(自定义包并且自动对 PyPI 镜像)。

分发

打包为可执行文件以便分发。

PyInstaller – 将 Python 程序转换成独立的执行文件(跨平台)。

dh-virtualenv – 构建并将 virtualenv 虚拟环境作为一个 Debian 包来发布。

Nuitka – 将脚本、模块、包编译成可执行文件或扩展模块。

py2app – 将 Python 脚本变为独立软件包(Mac OS X)。

py2exe – 将 Python 脚本变为独立软件包(Windows)。

pynsist – 一个用来创建 Windows 安装程序的工具,可以在安装程序中打包 Python本身。

构建工具

将源码编译成软件。

buildout – 一个构建系统,从多个组件来创建,组装和部署应用。

BitBake – 针对嵌入式 Linux 的类似 make 的构建工具。

fabricate – 对任何语言自动找到依赖关系的构建工具。

PlatformIO – 多平台命令行构建工具。

PyBuilder – 纯 Python 实现的持续化构建工具。

SCons – 软件构建工具。

交互式解析器

交互式 Python 解析器。

IPython – 功能丰富的工具,非常有效的使用交互式 Python。

bpython- 界面丰富的 Python 解析器。

ptpython – 高级交互式Python解析器, 构建于python-prompt-toolkit 之上。

文件

文件管理和 MIME(多用途的网际邮件扩充协议)类型检测。

imghdr – (Python 标准库)检测类型。

mimetypes – (Python 标准库)将文件名映射为 MIME 类型。

pathpy – 对 ospath 进行封装的模块。

pathlib – (Python34+ 标准库)跨平台的、面向对象的路径 *** 作库。

python-magic- 文件类型检测的第三方库 libmagic 的 Python 接口。

Unipath- 用面向对象的方式 *** 作文件和目录

watchdog – 管理文件系统事件的 API 和 shell 工具

日期和时间

*** 作日期和时间的类库。

arrow- 更好的 Python 日期时间 *** 作类库。

Chronyk – Python 3 的类库,用于解析手写格式的时间和日期。

dateutil – Python datetime 模块的扩展。

delorean- 解决 Python 中有关日期处理的棘手问题的库。

moment – 一个用来处理时间和日期的Python库。灵感来自于Momentjs。

PyTime – 一个简单易用的Python模块,用于通过字符串来 *** 作日期/时间。

pytz – 现代以及历史版本的世界时区定义。将时区数据库引入Python。

whenpy – 提供用户友好的函数来帮助用户进行常用的日期和时间 *** 作。

文本处理

用于解析和 *** 作文本的库。

通用

chardet – 字符编码检测器,兼容 Python2 和 Python3。

difflib – (Python 标准库)帮助我们进行差异化比较。

ftfy – 让Unicode文本更完整更连贯。

fuzzywuzzy – 模糊字符串匹配。

Levenshtein – 快速计算编辑距离以及字符串的相似度。

pangupy – 在中日韩语字符和数字字母之间添加空格。

pyfiglet -figlet 的 Python实现。

shortuuid – 一个生成器库,用以生成简洁的,明白的,URL 安全的 UUID。

unidecode – Unicode 文本的 ASCII 转换形式 。

uniout – 打印可读的字符,而不是转义的字符串。

xpinyin – 一个用于把汉字转换为拼音的库。

以上就是关于PyInstaller打包、解包与反编译.pyc文件全部的内容,包括:PyInstaller打包、解包与反编译.pyc文件、使用Cython、pyinstaller防止反编译、怎样反汇编bzImage-platinum-ChinaUnix博客等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10094842.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-05
下一篇 2023-05-05

发表评论

登录后才能评论

评论列表(0条)

保存