Kami perlu menulis beberapa program Python setiap hari, sama ada untuk memproses beberapa teks atau untuk melakukan beberapa kerja pengurusan sistem. Selepas atur cara ditulis, anda hanya perlu menaip arahan python untuk memulakan atur cara dan mula melaksanakannya:

$ python

Jadi, bagaimanakah fail teks .py ditukar langkah demi langkah menjadi satu yang boleh dilaksanakan oleh CPU? Bagaimana dengan arahan mesin? Selain itu, fail .pyc mungkin dijana semasa pelaksanaan program Apakah fungsi fail ini?

1. Proses pelaksanaan

Walaupun Python kelihatan lebih seperti bahasa yang ditafsirkan seperti skrip Shell dari segi tingkah laku, sebenarnya, prinsip pelaksanaan program Python pada asasnya sama dengan Java atau C# dan boleh diringkaskan untuk mesin maya dan kod bait. Python melaksanakan program dalam dua langkah: mula-mula menyusun kod atur cara menjadi kod bait, dan kemudian mulakan mesin maya untuk melaksanakan kod bait:

Walaupun arahan Python juga dipanggil Jurubahasa Python , tetapi pada asasnya berbeza daripada penterjemah bahasa skrip lain. Sebenarnya, penterjemah Python terdiri daripada dua bahagian: pengkompil dan mesin maya. Apabila jurubahasa Python dimulakan, ia melakukan dua langkah berikut terutamanya:

Pengkompil menyusun kod sumber Python dalam fail .py ke dalam kod bait Mesin maya melaksanakan kod bait yang dijana oleh pengkompil baris demi baris

Oleh itu, pernyataan Python dalam fail .py tidak ditukar terus kepada arahan mesin, tetapi kepada kod bait Python.

2. Bytecode

Hasil kompilasi program Python ialah bytecode, yang mengandungi banyak kandungan berkaitan tentang pengendalian Python. Oleh itu, sama ada untuk mempunyai pemahaman yang lebih mendalam tentang mekanisme pengendalian mesin maya Python atau untuk mengoptimumkan kecekapan pengendalian program Python, bytecode ialah kandungan utama. Jadi, apakah rupa Python bytecode? Bagaimanakah kita boleh mendapatkan bytecode program Python? Python menyediakan kompilasi fungsi terbina dalam untuk kompilasi segera kod sumber. Kita hanya perlu memanggil fungsi kompilasi dengan kod sumber untuk disusun sebagai parameter untuk mendapatkan hasil kompilasi kod sumber.

3. Penyusunan kod sumber

Seterusnya, kami menyusun atur cara melalui fungsi penyusunan:

Kod sumber disimpan dalam fail

PI = 3.14

def circle_area(r):
    return PI * r ** 2

class Person(object):
    def __init__(self, name): = name

    def say(self):
        print('i am',

Kompil Sebelum ini, kod sumber perlu dibaca daripada fail:

>>> text = open('D:\myspace\code\pythonCode\mix\').read()
>>> print(text)
PI = 3.14

def circle_area(r):
    return PI * r ** 2

class Person(object):
    def __init__(self, name): = name

    def say(self):
        print('i am',

dan kemudian fungsi kompil dipanggil untuk menyusun kod sumber:

>>> result = compile(text,'D:\myspace\code\pythonCode\mix\', 'exec')

Terdapat 3 parameter yang diperlukan untuk fungsi penyusunan:

sumber : Kod sumber yang akan disusun

nama fail: nama fail di mana kod sumber terletak

mod: mod penyusunan, exec bermaksud menyusun kod sumber sebagai modul

Tiga mod kompilasi:

exec: digunakan untuk menyusun kod sumber modul

single: digunakan untuk menyusun pernyataan Python tunggal (secara interaktif)

eval: digunakan untuk menyusun ungkapan eval

4. PyCodeObject

Melalui fungsi kompilasi, kami mendapat hasil penyusunan kod sumber akhir:

>>> result
<code object <module> at 0x000001DEC2FCF680, file "D:\myspace\code\pythonCode\mix\", line 1>
>>> result.__class__
<class &#39;code&#39;>

Akhirnya kami mendapat kod jenis objek, dan struktur asasnya yang sepadan ialah PyCodeObject

Kod sumber PyCodeObject adalah seperti berikut:

/* Bytecode object */
struct PyCodeObject {
    int co_argcount;            /* #arguments, except *args */
    int co_posonlyargcount;     /* #positional only arguments */
    int co_kwonlyargcount;      /* #keyword only arguments */
    int co_nlocals;             /* #local variables */
    int co_stacksize;           /* #entries needed for evaluation stack */
    int co_flags;               /* CO_..., see below */
    int co_firstlineno;         /* first source line number */
    PyObject *co_code;          /* instruction opcodes */
    PyObject *co_consts;        /* list (constants used) */
    PyObject *co_names;         /* list of strings (names used) */
    PyObject *co_varnames;      /* tuple of strings (local variable names) */
    PyObject *co_freevars;      /* tuple of strings (free variable names) */
    PyObject *co_cellvars;      /* tuple of strings (cell variable names) */
    /* The rest aren&#39;t used in either hash or comparisons, except for co_name,
       used in both. This is done to preserve the name and line number
       for tracebacks and debuggers; otherwise, constant de-duplication
       would collapse identical functions/lambdas defined on different lines.
    Py_ssize_t *co_cell2arg;    /* Maps cell vars which are arguments. */
    PyObject *co_filename;      /* unicode (where it was loaded from) */
    PyObject *co_name;          /* unicode (name, for reference) */
    PyObject *co_linetable;     /* string (encoding addr<->lineno mapping) See
                                   Objects/lnotab_notes.txt for details. */
    void *co_zombieframe;       /* for optimization only (see frameobject.c) */
    PyObject *co_weakreflist;   /* to support weakrefs to code objects */
    /* Scratch space for extra data relating to the code object.
       Type is a void* to keep the format private in codeobject.c to force
       people to go through the proper APIs. */
    void *co_extra;

    /* Per opcodes just-in-time cache
     * To reduce cache size, we use indirect mapping from opcode index to
     * cache object:
     *   cache = co_opcache[co_opcache_map[next_instr - first_instr] - 1]

    // co_opcache_map is indexed by (next_instr - first_instr).
    //  * 0 means there is no cache for this opcode.
    //  * n > 0 means there is cache in co_opcache[n-1].
    unsigned char *co_opcache_map;
    _PyOpcache *co_opcache;
    int co_opcache_flag;  // used to determine when create a cache.
    unsigned char co_opcache_size;  // length of co_opcache.

Objek kod PyCodeObject digunakan untuk menyimpan hasil kompilasi, termasuk kod bait dan pemalar, nama, dsb. terlibat dalam kod. Medan utama termasuk:

字段 用途
co_argcount 参数个数
co_kwonlyargcount 关键字参数个数
co_nlocals 局部变量个数
co_stacksize 执行代码所需栈空间
co_flags 标识
co_firstlineno 代码块首行行号
co_code 指令操作码,即字节码
co_consts 常量列表
co_names 名字列表
co_varnames 局部变量名列表



>>> result.co_code


>>> result.co_names
(&#39;PI&#39;, &#39;circle_area&#39;, &#39;object&#39;, &#39;Person&#39;)


>>> result.co_consts
(3.14, <code object circle_area at 0x0000023D04D3F310, file "D:\myspace\code\pythonCode\mix\", line 3>, &#39;circle_area&#39;, <code object Person at 0x0000023D04D3F5D0, file "D:\myspace\code\pythonCode\mix\", line 6>, &#39;Person&#39;, None)


>>> person_code = result.co_consts[3]
>>> person_code
<code object Person at 0x0000023D04D3F5D0, file "D:\myspace\code\pythonCode\mix\", line 6>
>>> person_code.co_consts
(&#39;Person&#39;, <code object __init__ at 0x0000023D04D3F470, file "D:\myspace\code\pythonCode\mix\", line 7>, &#39;Person.__init__&#39;, <code object say at 0x0000023D04D3F520, file "D:\myspace\code\pythonCode\mix\", line 10>, &#39;Person.say&#39;, None)


5. 反编译



>>> import dis
>>> dis.dis(result.co_code)
 0 LOAD_CONST               0 (0)
 2 STORE_NAME               0 (0)
 4 LOAD_CONST               1 (1)
 6 LOAD_CONST               2 (2)
 8 MAKE_FUNCTION            0
10 STORE_NAME               1 (1)
14 LOAD_CONST               3 (3)
16 LOAD_CONST               4 (4)
18 MAKE_FUNCTION            0
20 LOAD_CONST               4 (4)
22 LOAD_NAME                2 (2)
24 CALL_FUNCTION            3
26 STORE_NAME               3 (3)
28 LOAD_CONST               5 (5)


>>> result.co_consts[0]3.14



  1           0 LOAD_CONST               0 (3.14)
              2 STORE_NAME               0 (PI)

  3           4 LOAD_CONST               1 (<code object circle_area at 0x0000023D04D3F310, file "D:\myspace\code\pythonCode\mix\", line 3>)
              6 LOAD_CONST               2 (&#39;circle_area&#39;)
              8 MAKE_FUNCTION            0
             10 STORE_NAME               1 (circle_area)

  6          12 LOAD_BUILD_CLASS
             14 LOAD_CONST               3 (<code object Person at 0x0000023D04D3F5D0, file "D:\myspace\code\pythonCode\mix\", line 6>)
             16 LOAD_CONST               4 (&#39;Person&#39;)
             18 MAKE_FUNCTION            0
             20 LOAD_CONST               4 (&#39;Person&#39;)
             22 LOAD_NAME                2 (object)
             24 CALL_FUNCTION            3
             26 STORE_NAME               3 (Person)
             28 LOAD_CONST               5 (None)
             30 RETURN_VALUE

Disassembly of <code object circle_area at 0x0000023D04D3F310, file "D:\myspace\code\pythonCode\mix\", line 3>:
  4           0 LOAD_GLOBAL              0 (PI)
              2 LOAD_FAST                0 (r)
              4 LOAD_CONST               1 (2)
              6 BINARY_POWER
              8 BINARY_MULTIPLY
             10 RETURN_VALUE

Disassembly of <code object Person at 0x0000023D04D3F5D0, file "D:\myspace\code\pythonCode\mix\", line 6>:
  6           0 LOAD_NAME                0 (__name__)
              2 STORE_NAME               1 (__module__)
              4 LOAD_CONST               0 (&#39;Person&#39;)
              6 STORE_NAME               2 (__qualname__)

  7           8 LOAD_CONST               1 (<code object __init__ at 0x0000023D04D3F470, file "D:\myspace\code\pythonCode\mix\", line 7>)
             10 LOAD_CONST               2 (&#39;Person.__init__&#39;)
             12 MAKE_FUNCTION            0
             14 STORE_NAME               3 (__init__)

 10          16 LOAD_CONST               3 (<code object say at 0x0000023D04D3F520, file "D:\myspace\code\pythonCode\mix\", line 10>)
             18 LOAD_CONST               4 (&#39;Person.say&#39;)
             20 MAKE_FUNCTION            0
             22 STORE_NAME               4 (say)
             24 LOAD_CONST               5 (None)
             26 RETURN_VALUE

Disassembly of <code object __init__ at 0x0000023D04D3F470, file "D:\myspace\code\pythonCode\mix\", line 7>:
  8           0 LOAD_FAST                1 (name)
              2 LOAD_FAST                0 (self)
              4 STORE_ATTR               0 (name)
              6 LOAD_CONST               0 (None)
              8 RETURN_VALUE

Disassembly of <code object say at 0x0000023D04D3F520, file "D:\myspace\code\pythonCode\mix\", line 10>:
 11           0 LOAD_GLOBAL              0 (print)
              2 LOAD_CONST               1 (&#39;i am&#39;)
              4 LOAD_FAST                0 (self)
              6 LOAD_ATTR                1 (name)
              8 CALL_FUNCTION            2
             10 POP_TOP
             12 LOAD_CONST               0 (None)
             14 RETURN_VALUE

操作数指定的常量或名字的实际值在旁边的括号内列出,此外,字节码以语句为单位进行了分组,中间以空行隔开,语句的行号在字节码前面给出。例如PI = 3.14这个语句就被会变成了两条字节码:

  1           0 LOAD_CONST               0 (3.14)
              2 STORE_NAME               0 (PI)

6. pyc


>>> import demo

Atas ialah kandungan terperinci Proses pelaksanaan program Python termasuk menukar kod sumber kepada kod bait (iaitu kompilasi) dan melaksanakan kod bait. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

