首頁  >  文章  >  後端開發  >  如何實現 Python 的惰性導入-lazy import

如何實現 Python 的惰性導入-lazy import

王林
王林轉載
2023-04-20 11:04:061221瀏覽

如果你的 Python 程式程式有大量的 import,而且啟動非常慢,那麼你應該嘗試懶導入,本文分享一種實現惰性導入的一種方法。雖然 PEP0690[1] 已經提案讓 Python 編譯器(-L) 或標準函式庫加入這個功能,但目前的 Python 版本還未實現。

眾所周知,Python 應用程式在執行使用者的實際操作之前,會執行import 操作,不同的模組可能來自不同的位置,某些模組的運作可能非常耗時,某些模組可能根本不會被用戶調用,因此許多模組的導入純粹是浪費時間。

因此我們需要惰性導入,當應用惰性導入時,執行import foo 只會把名字foo 加到全域的全名空間(globals())中當一個懶引用(lazy reference),編譯器遇到任何存取foo 的程式碼時才會執行真正的import 操作。類似的,from foo import bar 會把 bar 加到命名空間,當遇到呼叫 bar 的程式碼時,就把 foo 導入。

寫程式碼實作

那怎麼寫程式碼實作呢?其實不必寫程式碼實現,已經有專案實現了懶導入功能,那就是TensorFlow,它的程式碼並沒有任何三方庫依賴,我把它放到這裡,以後大家需要懶導入的時候直接把 LazyLoader[2] 類複製到自己的專案中去即可。

原始程式碼如下:

# Code copied from https://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/util/lazy_loader.py
"""A LazyLoader class."""

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import importlib
import types


class LazyLoader(types.ModuleType):
"""Lazily import a module, mainly to avoid pulling in large dependencies.

`contrib`, and `ffmpeg` are examples of modules that are large and not always
needed, and this allows them to only be loaded when they are used.
"""

# The lint error here is incorrect.
def __init__(self, local_name, parent_module_globals, name):# pylint: disable=super-on-old-class
self._local_name = local_name
self._parent_module_globals = parent_module_globals

super(LazyLoader, self).__init__(name)

def _load(self):
# Import the target module and insert it into the parent's namespace
module = importlib.import_module(self.__name__)
self._parent_module_globals[self._local_name] = module

# Update this object's dict so that if someone keeps a reference to the
# LazyLoader, lookups are efficient (__getattr__ is only called on lookups
# that fail).
self.__dict__.update(module.__dict__)

return module

def __getattr__(self, item):
module = self._load()
return getattr(module, item)

def __dir__(self):
module = self._load()
return dir(module)

程式碼說明:

類別LazyLoader 繼承自types.ModuleType,初始化函數確保惰性模組將會像真正的模組同樣正確地加入到全域變數中,只要真正用到模組的時候,也就是執行__getattr__ 或__dir__ 時,才會真正的import 實際模組,更新全域變數以指向實際模組,並且將其所有狀態(__dict__)更新為實際模組的狀態,以便對延遲載入的引用,載入模組不需要每次存取都經過載入過程。

程式碼使用:

正常情況下我們這樣導入模組:

import tensorflow.contrib as contrib

其對應的惰性導入版本如下:

contrib = LazyLoader('contrib', globals(), 'tensorflow.contrib')

PEP0690 建議的做法

PEP0690 的提案是在編譯器( C 程式碼)層面實現,這樣效能會更好。其使用方法有兩種。

其一

一種方式是執行Python 腳本時加入-L 參數,例如有兩個檔案spam.py 內容如下:

import time
time.sleep(10)
print("spam loaded")

egg.py 內容如下:

import spam
print("imports done")

#正常導入情況下,會等10 秒後先列印"spam loaded",然後列印"imports done",執行 python -L eggs.py 時,spam 模組永遠不會導入,應用spam 模組壓根就沒有用到。如果 egg.py 內容如下:

import spam
print("imports done")
spam

當執行 python -L eggs.py 時會先列印 "imports done",10 秒之後列印 "spam loaded")。

其二

另一種方式是呼叫標準函式庫importlib 的方法:

import importlib 
importlib.set_lazy_imports(True)

如果某些模組不能懶加載,需要排除,可以這樣

import importlib 
importlib.set_lazy_imports(True,excluding=["one.mod", "another"])

還可以這樣:

from importlib import eager_imports

with eager_imports():
import foo
import bar

最後的話

經過專業人士在在真實的Python 命令列程式上做測試,應用惰性導入後,可以讓啟動時間提高70%,記憶體使用減少40%,非常可觀了。

參考資料

[1]PEP0690: https://github.com/python/peps/blob/main/pep-0690.rst

[2]LazyLoader : https://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/util/lazy_loader.py

以上是如何實現 Python 的惰性導入-lazy import的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除