常见的 Python 文件后缀有:py@H_502_6@、
pyc@H_502_6@ 、
pyo@H_502_6@、
pyi@H_502_6@、
pyw@H_502_6@、
pyd@H_502_6@、
pyx@H_502_6@ 等。
本文只介绍相对常见的一些后缀名,至于一些特别冷门的文件格式,例如一些文章提到的pyz@H_502_6@、
pywz@H_502_6@、
rpy@H_502_6@、
pyde@H_502_6@、
pyp@H_502_6@、
pyt@H_502_6@等,并没有进行研究。因为这些扩展名资料很少,网上搜到的文章似乎都是同一个出处,只是简单提了一句,说了等于没说。
最常见的 Python 源代码文件。
实际上如果用 python + 文件@H_502_6@ 的方式运行代码,只要文件内容相同,后缀名是不重要的,也就是说下面的运行结果都是等价的:
python test.pypython test.txtpython test@H_502_6@
pyc常见的 Python 字节码缓存文件。
pyc@H_502_6@文件和
py@H_502_6@文件一样,都可以直接执行,下面的运行结果都是等价的:
python test.pypython test.pyc@H_502_6@
作用一:提升加载性能我们知道 Python 代码在执行时,会先由 Python 解析器翻译成 PyCodeObject 对象,俗称字节码 (Byte code),然后交给 Python 解释器来执行字节码。
上述过程中翻译后的字节码是保存在内存中,程序运行结束就没了,而代码没有修改的情况下,每次生成的字节码是一样的,所以每次跑程序都再走一遍翻译字节码的过程有点浪费性能。因此为了提高加载效率,Python 在程序执行结束后会把每个文件的字节码写入到硬盘中保存为 xxx.pyc@H_502_6@ 文件,这样下一次再执行这个程序时先在目录下找有没有
xxx.pyc@H_502_6@ 文件,如果有这个对应文件且修改时间和
xxx.py@H_502_6@ 文件的修改时间一样,就不用再执行翻译成字节码的过程,直接读取
xxx.pyc@H_502_6@ 文件执行。其实缓存
pyc@H_502_6@ 文件的方式对性能的提升很微小,只有项目文件非常多的时候才能看到显著提升。
默认情况下,我们发现并不是所有的py@H_502_6@ 文件都会自动生成
pyc@H_502_6@ 文件,只有被其他文件 import 过的文件才会生成对应的
pyc@H_502_6@ 文件。可能 Python 认为被 import 的文件重复使用的概率比较高,而主文件一般只需要加载一次。
简单做个实验可以验证,新建两个 Python 文件hello.py@H_502_6@和
import.py@H_502_6@,内容如下:
# hello.pyprint("hello")@H_502_6@
# import.pyimpot hello@H_502_6@
直接运行 python hello.py@H_502_6@,并没有生成
pyc@H_502_6@ 文件,而运行
python import.py@H_502_6@,在当前目录下生成了
hello.py@H_502_6@对应的
pyc@H_502_6@ 文件。
这里 Python2 和 python3 有些不同, Python2 是直接在当前目录下生成同名 pyc@H_502_6@ 文件,python3 是在当前目录下创建了
__pycache__@H_502_6@文件夹,然后在文件夹内创建了一个包含 Python 版本信息的
xxx.cpython-37.pyc@H_502_6@ 文件。
Python2
作用二:隐藏源代码
pyc@H_502_6@格式是给解释器看的二进制文件,直接用编辑器打开看上去是乱码,所以将 Python 代码先编译成
pyc@H_502_6@文件再交付给别人使用,一定程度上实现隐藏源代码的效果。
默认情况下,主文件不会生成pyc@H_502_6@文件,可以通过 Python 自带的
py_compile@H_502_6@或
compileall@H_502_6@ 库,手动将所有
py@H_502_6@文件"编译"成
pyc@H_502_6@文件。
python -m py_compile *.pypython -m compileall *.py@H_502_6@
Python2
python3
前面说了,是“一定程度上实现隐藏源代码的效果”,其实可以通过反编译pyc@H_502_6@文件来获得
py@H_502_6@源码,而且反编译的难度并不大。
uncompyle6@H_502_6@是一个专门用于将
pyc@H_502_6@反编译为
py@H_502_6@源码的第三方库,安装方式:
pip install uncompyle6@H_502_6@
执行下面命令可以将刚才生成的pyc@H_502_6@反编译为
py@H_502_6@文件:
uncompyle6 -o . *.pyc@H_502_6@
打开生成的文件
hello.cpython-37.py@H_502_6@和import.cpython-37.py@H_502_6@,可以看到和之前的py@H_502_6@代码内容一模一样,不过多了一些 Python 的版本信息。
魔高一尺,道高一丈,有反编译技术就有防止反编译技术,更多了解参见这篇文章:通过字节码混淆来保护Python代码。pyo优化后的 Python 字节码缓存文件。
pyo@H_502_6@文件的作用和pyc@H_502_6@文件没啥区别,唯一的优化就是去掉了断言语句,即assert@H_502_6@语句。官方文档描述:
When the Python interpreter is invoked with the -O flag, optimized code is generated and stored in .pyo files. The optimizer currently doesn’t help much; it only removes assert statements. When -O is used, all bytecode is optimized; .pyc files are ignored and .py files are compiled to optimized bytecode.
同样可以利用py_compile@H_502_6@或compileall@H_502_6@ 库将上面示例的两个文件编译成pyo@H_502_6@文件,只是多加一个参数-O@H_502_6@,运行结果也没有任何变化:
python -O -m py_compile *.pypython -O -m compileall *.py@H_502_6@
从 python3.5 开始,Python 只使用 pyc@H_502_6@ 而不再使用pyo@H_502_6@,所以下面命令也无法生成 pyo@H_502_6@文件,生成的依然是 pyc@H_502_6@ 文件:python3 -O -m py_compile *.pypython3 -O -m compileall *.py@H_502_6@
pyiPython 的存根文件,用于代码检查时的类型提示。
pyi@H_502_6@文件是PEP484@H_502_6@提案规定的一种用于 Python 代码类型提示(Type Hints)的文件。PEP@H_502_6@即Python Enhancement Proposals@H_502_6@,是经过 Python 社区核心开发者讨论并一致同意后,对外发布的一些正式规范文档,例如我们常说的Python之禅(PEP20@H_502_6@),代码风格 PEP8 格式化(PEP8@H_502_6@),将 print 改为函数(PEP3105@H_502_6@)等,关于PEP@H_502_6@的更多了解见这篇文章:学习Python,怎能不懂点PEP呢?。
常用的 IDE 都会有类型检查提示功能,比如在 PyCharm 中,当我们给一个函数传入一个错误的类型时会给出对应的提示,这其实不是 IDE 的特殊开发的功能,它只是集成了PEP484@H_502_6@的规定,利用了已经预先生成好的 pyi@H_502_6@文件。
举个例子,
os.makedirs@H_502_6@是标准库中用于创建文件夹路径的函数,它的入参应该是一个字符串类型,如果传入一个 int 类型,IDE 会立刻给出提示。
按住ctrl@H_502_6@点进去,进入到 os 模块定义os.makedirs@H_502_6@的地方,发现前面有个*@H_502_6@号,鼠标放上去会提示Has stub item in __init__.pyi@H_502_6@。
点击*@H_502_6@号就会跳到对应的__init__.pyi@H_502_6@文件,这个文件里按照PEP484@H_502_6@规定,为os@H_502_6@模块每个函数都定义了对应的类型检查规则。
关于pyi@H_502_6@文件的定义规则以及自己如何生成,详见官方文档:PEP 484 – Type Hints
pyw一种 Python 源代码文件,一般只存在于 windows 系统。
pyw@H_502_6@文件和py@H_502_6@文件除了后缀名不一样之外没有任何区别,两者都是 Python 源码文件,前面 py@H_502_6@那一节说过“如果用 python + 文件@H_502_6@ 的方式运行代码,只要文件内容相同,后缀名是不重要的”,这一点在 windows 系统和 linux 系统都是一样的。
windows 系统,新建两个内容相同的 Python 文件hello.py@H_502_6@和hello.pyw@H_502_6@,用python + 文件@H_502_6@ 的方式运行,结果一样:
# hello.pyprint("hello")@H_502_6@
# hello.pywprint("hello")@H_502_6@
那为什么还要有pyw@H_502_6@文件呢?在windows 系统上双击文件时,系统会根据文件扩展名来调用关联的exe@H_502_6@程序来运行这个文件,打开 Python 安装目录,可以看到有python.exe@H_502_6@和pythonw.exe@H_502_6@两个exe@H_502_6@,其中python.exe@H_502_6@关联了py@H_502_6@文件,pythonw.exe@H_502_6@关联了pyw@H_502_6@文件。跟 python.exe@H_502_6@ 相比,pythonw.exe@H_502_6@运行时不会d出控制台窗口, stdout 、stderr 和 stdin 都无效,所以像 print 这种把内容输出到 stdout 的 *** 作就不会有打印结果(cmd 窗口都没有了也没有地方显示了)。
所以在用 Python 开发 GUI 程序时,如果不想让程序运行的时候d出一个黑乎乎的 cmd 框,就可以将源码文件后缀名改为pyw@H_502_6@格式。但是我感觉这个pww@H_502_6@格式用处并不大,实际使用很少有人双击py@H_502_6@或者pyw@H_502_6@文件来运行 Python 代码。我之前曾用tkinter@H_502_6@开发过带 windows 界面的 Python 程序,当时是通过双击 bat@H_502_6@脚本启动 Python 脚本同时关闭 cmd 界面框,来避免d出黑框框的。
pydPython 可直接调用的 C 语言动态链接库文件,一般只存在于 windows 系统。
Python 是一种胶水语言,我们可以将对速度要求比较高的那一部分代码使用 C 语言编写,编译成动态链接库文件,再通过 Python 来调用。一般来说,在 linux 上是 so@H_502_6@文件,在 windows 系统上是DLL@H_502_6@文件。
例如有一个 C 语言编写的 windows 动态链接库 test_lib.dll@H_502_6@,编译前的代码如下:
int sum(int x, int y){ return x + y;}@H_502_6@
我们可以在 Python 代码中通过下面的方式来调用
# test_lib.dll 放在当前目录下import ctypesfrom ctypes import *test_lib = ctypes.windll.Loadlibrary("test_lib.dll")a = ctypes.c_int(1)b = ctypes.c_int(2)out = test_lib.sum(a, b)print(out) # 3@H_502_6@
在 windows 系统上,Python 还有一种 pyd@H_502_6@格式的动态链接库,上面的调用方式是先通过ctypes.windll.Loadlibrary@H_502_6@ 方法将动态链接库加载进来,而pyd@H_502_6@格式就可以在 Python 代码中直接import@H_502_6@进来,类似下面这样:
# test_lib.pyd 放在当前目录下import test_libout = test_lib.sum(1, 2)print(out) # 3@H_502_6@
关于 pyd@H_502_6@文件和dll@H_502_6@文件的区别,可参考官方文档的说明:
Is a *.pyd@H_502_6@ file the same as a DLL?
Yes, .pyd files are dll’s, but there are a few differences. If you have a DLL named foo.pyd@H_502_6@, then it must have a function PyInit_foo()@H_502_6@. You can then write Python “import foo”, and Python will search for foo.pyd (as well as foo.py, foo.pyc) and if it finds it, will attempt to call PyInit_foo()@H_502_6@ to initialize it. You do not link your .exe with foo.lib, as that would cause windows to require the DLL to be present.
Note that the search path for foo.pyd is PYTHONPATH, not the same as the path that windows uses to search for foo.dll. Also, foo.pyd need not be present to run your program, whereas if you linked your program with a dll, the dll is required. Of course, foo.pyd is required if you want to say import foo@H_502_6@. In a DLL, linkage is declared in the source code with __declspec(dllexport)@H_502_6@. In a .pyd, linkage is defined in a List of available functions.
C 语言代码和 Python 代码都可以通过一定的方法编译成pyd@H_502_6@格式的文件,本人并没有实际使用过pyd@H_502_6@文件,详细方法可参考下面的文章:
使用C++创建Pyd文件扩展Python模块
Python源代码保护(Python文件编译生成pyd/so库文件)
pyxCython 源代码文件。
注意是 Cython 不是 cpython。Cython 可以说是一种编程语言, 它结合了Python 的语法和有 C/C++的效率,用 Cython 写完的代码可以很容易转成 C 语言代码,然后又可以再编译成动态链接库(pyd@H_502_6@或dll@H_502_6@)供 Python 调用,所以 Cython 一般用来编写 Python 的 C 扩展,上面说的 Python 文件编译生成 pyd@H_502_6@ 文件就是利用 Cython 来实现的 。Cython 的源代码文件一般为pyx@H_502_6@后缀。
总结后缀名 作用 py 最常见的 Python 源代码文件。 pyc 常见的 Python 字节码缓存文件,可以反编译成 py 文件。 pyo 另一种 Python 字节码缓存文件,只存在于 Python2 及 python3.5 之前的版本。 pyi Python 的存根文件,常用于 IDE 代码格式检查时的类型提示。 pyw 另一种 Python 源代码文件,一般只存在于 windows 系统。 pyd 一种 Python 可直接调用的 C 语言动态链接库文件,一般只存在于 windows 系统。 pyx Cython 源代码文件,一般用来编写 Python 的 C 扩展。
总结 以上是内存溢出为你收集整理的Python 相关文件常见的后缀名详解全部内容,希望文章能够帮你解决Python 相关文件常见的后缀名详解所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)