Python は Web サイト用の Web サーバーゲートウェイインターフェイスを構築します-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Python は Web サイト用の Web サーバーゲートウェイインターフェイスを構築します

高洛峰

Feb 22, 2017 am 10:48 AM

この記事は、上記に続いて、Web サーバーゲートウェイインターフェイス WSGI の関連情報を説明するシリーズの 2 つ目です。必要な方は参照してください。

Python で Web サイトを構築する Web サーバーと Web フレームワークでは、Web サーバー、Web アプリケーション、Web フレームワークの概念を明確にしました。 Python の場合、ますます多くの Web フレームワークが登場しており、選択肢が増えているだけでなく、Web サーバーの選択肢も限られています。 Java には多数の Web フレームワークもあります。サーブレット API があるため、Java Web フレームワークで作成されたアプリケーションはすべて、任意の Web サーバー上で実行できます。

もちろん、Python コミュニティも Web サーバーとアプリケーションに適応するためにこのような API セットを必要としています。この API セットは WSGI (Python Web Server Gateway Interface) であり、PEP 3333 で詳しく説明されています。簡単に言うと、WSGI は Web サーバーと Web アプリケーションを接続するブリッジであり、一方では Web サーバーから元の HTTP データを取得し、それを統一された形式に処理して、Web アプリケーションに渡します。アプリケーション/フレームワーク側からビジネスを実行し、応答コンテンツを生成してサーバーに渡します。

WSGI を介して Web サーバーとフレームワークを結合する詳細なプロセスを次の図に示します。

Python 搭建Web站点之Web服务器网关接口

WSGI サーバーの適応

具体的な説明は次のとおりです:

アプリケーション (ネットワークフレームワーク) は、 application という名前のアプリケーション (WSGI プロトコルでは、このオブジェクトの実装方法は指定されていません)。サーバーは HTTP クライアントからリクエストを受信するたびに、呼び出し可能オブジェクトアプリケーションを呼び出し、パラメータとして environ という名前の辞書と start_response という名前の呼び出し可能オブジェクトを渡します。フレームワーク/アプリケーションは HTTP ステータスコードと HTTP 応答ヘッダーを生成し、両方を start_response に渡し、サーバーがそれらを保存するのを待ちます。さらに、フレームワーク/アプリは応答の本文を返します。サーバーは、ステータスコード、応答ヘッダー、および応答本文を HTTP 応答に結合し、クライアントに返します (このステップは WSGI プロトコルに属しません)。

WSGI がサーバー側とアプリケーション側からそれぞれどのように適応するかを見てみましょう。

サーバー側

クライアント (通常はブラウザ) によって発行された各 HTTP リクエストは、リクエスト行、メッセージヘッダー、およびこのリクエストの関連詳細を含むリクエスト本文の 3 つの部分で構成されていることがわかっています。例:

メソッド: GET、POST など、Request-URI によって識別されるリソース上で実行されるメソッドを示します。 User-Agent: クライアントがオペレーティングシステム、ブラウザー、その他の属性をサーバーに伝えることができます。サーバーがクライアントから HTTP リクエストを受信した後、WSGI インターフェースはこれらのリクエストフィールドを統合して、アプリケーションサーバーインターフェース (実際にはフレームワーク) に渡しやすくする必要があります。 Web サーバーがアプリケーションプログラムに渡す具体的なデータは、CGI (Common Gateway Interface、Common Gateway Interface) の時点で詳細に指定されており、これらのデータは CGI 環境変数と呼ばれます。 WSGI は CGI 環境変数の内容を継承し、Web サーバーがこれらの環境変数 (通常は environ という名前) を保存するための辞書を作成する必要があります。 CGI によって定義された変数に加えて、environ は WSGI によって定義されたいくつかの変数も保存する必要があります。さらに、environ 変数を参照して、どのような変数があるかを確認できます。

次に、WSGI インターフェースは、処理のためにアプリケーションに環境を渡す必要があります。ここで、WSGI は、アプリケーションが呼び出し可能なオブジェクトアプリケーションを提供し、サーバーがアプリケーションを呼び出し、戻り値を HTTP 応答本文として取得することを規定しています。サーバーがアプリケーションを呼び出すとき、サーバーは 2 つの変数を提供する必要があります。1 つは前述の変数辞書環境で、もう 1 つは呼び出し可能なオブジェクト start_response で、完全な HTTP 応答を取得できるようにステータスコードと応答ヘッダーを生成します。 Web サーバーは応答をクライアントに返し、完全な HTTP 要求と応答のプロセスが完了します。

wsgiref 分析

Python には、WSGI インターフェースを実装する Web サーバーが組み込まれています。これは、純粋な Python で書かれた WSGI サーバーのリファレンス実装です。まず、次のコードで Web サーバーを起動するとします。

# Instantiate the server 
httpd = make_server( 
 &#39;localhost&#39;, # The host name 
 8051,   # A port number where to wait for the request 
 application  # The application object name, in this case a function 
) 
# Wait for a single request, serve it and quit 
httpd.handle_request()

次に、Web サーバーを使用してリクエストを受信し、environ を生成し、アプリケーションを呼び出してリクエストを処理します。このメイン行はソースを分析します。コード呼び出しプロセス。以下の図に示すように簡略化されています。

Python 搭建Web站点之Web服务器网关接口

WSGI サーバー呼び出しプロセス

这里主要有三个类，WSGIServer，WSGIRequestHandler，ServerHandle。WSGIServer 是Web服务器类，可以提供server_address(IP:Port)和 WSGIRequestHandler 类来进行初始化获得一个server对象。该对象监听响应的端口，收到HTTP请求后通过 finish_request 创建一个RequestHandler 类的实例，在该实例的初始化过程中会生成一个 Handle 类实例，然后调用其 run(application) 函数，在该函数里面再调用应用程序提供的 application对象来生成响应。

这三个类的继承关系如下图所示：

WSGI 类继承关系图

其中 TCPServer 使用 socket 来完成 TCP 通信，HTTPServer 则是用来做 HTTP 层面的处理。同样的，StreamRequestHandler 来处理 stream socket，BaseHTTPRequestHandler 则是用来处理 HTTP 层面的内容，这部分和 WSGI 接口关系不大，更多的是 Web 服务器的具体实现，可以忽略。

微服务器实例

如果上面的 wsgiref 过于复杂的话，下面一起来实现一个微小的 Web 服务器，便于我们理解 Web 服务器端 WSGI 接口的实现。代码摘自自己动手开发网络服务器(二)，放在 gist 上，主要结构如下：

class WSGIServer(object): # 套接字参数 address_family, socket_type = socket.AF_INET, socket.SOCK_STREAM request_queue_size = 1 def __init__(self, server_address): # TCP 服务端初始化：创建套接字，绑定地址，监听端口 # 获取服务器地址，端口 def set_app(self, application): # 获取框架提供的 application self.application = application def serve_forever(self): # 处理 TCP 连接：获取请求内容，调用处理函数 def handle_request(self): # 解析 HTTP 请求，获取 environ，处理请求内容，返回HTTP响应结果 env = self.get_environ() result = self.application(env, self.start_response) self.finish_response(result) def parse_request(self, text): # 解析 HTTP 请求 def get_environ(self): # 分析 environ 参数，这里只是示例，实际情况有很多参数。 env['wsgi.url_scheme'] = 'http' ... env['REQUEST_METHOD'] = self.request_method # GET ... return env def start_response(self, status, response_headers, exc_info=None): # 添加响应头，状态码 self.headers_set = [status, response_headers + server_headers] def finish_response(self, result): # 返回 HTTP 响应信息 SERVER_ADDRESS = (HOST, PORT) = '', 8888 # 创建一个服务器实例 def make_server(server_address, application): server = WSGIServer(server_address) server.set_app(application) return server

目前支持 WSGI 的成熟Web服务器有很多，Gunicorn是相当不错的一个。它脱胎于ruby社区的Unicorn，成功移植到python上，成为一个WSGI HTTP Server。有以下优点：

容易配置可以自动管理多个worker进程选择不同的后台扩展接口(sync, gevent, tornado等) 应用程序端(框架)

和服务器端相比，应用程序端(也可以认为框架)要做的事情就简单很多，它只需要提供一个可调用对象(一般习惯将其命名为application)，这个对象接收服务器端传递的两个参数 environ 和 start_response。这里的可调用对象不仅可以是函数，还可以是类(下面第二个示例)或者拥有 __call__ 方法的实例，总之只要可以接受前面说的两个参数，并且返回值可以被服务器进行迭代即可。

Application 具体要做的就是根据 environ 里面提供的关于 HTTP 请求的信息，进行一定的业务处理，返回一个可迭代对象，服务器端通过迭代这个对象，来获得 HTTP 响应的正文。如果没有响应正文，那么可以返回None。

同时，application 还会调用服务器提供的 start_response，产生HTTP响应的状态码和响应头，原型如下：

def start_response(self, status, headers,exc_info=None):

Application 需要提供 status：一个字符串，表示HTTP响应状态字符串，还有 response_headers: 一个列表，包含有如下形式的元组：(header_name, header_value)，用来表示HTTP响应的headers。同时 exc_info 是可选的，用于出错时，server需要返回给浏览器的信息。

到这里为止，我们就可以实现一个简单的 application 了，如下所示：

def simple_app(environ, start_response): """Simplest possible application function""" HELLO_WORLD = "Hello world!\n" status = '200 OK' response_headers = [('Content-type', 'text/plain')] start_response(status, response_headers) return [HELLO_WORLD]

或者用类实现如下。

class AppClass: """Produce the same output, but using a class""" def __init__(self, environ, start_response): self.environ = environ self.start = start_response def __iter__(self): ... HELLO_WORLD = "Hello world!\n" yield HELLO_WORLD

注意这里 AppClass 类本身就是 application，用 environ 和 start_response 调用(实例化)它返回一个实例对象，这个实例对象本身是可迭代的，符合 WSGI 对 application 的要求。

如果想使用 AppClass 类的对象作为 application，那么必须给类添加一个 __call__ 方法，接受 environ 和 start_response 为参数，返回可迭代对象，如下所示：

class AppClass: """Produce the same output, but using an object""" def __call__(self, environ, start_response):

这部分涉及到python的一些高级特性，比如 yield 和 magic method，可以参考我总结的python语言要点来理解。

Flask 中的 WSGI

flask 是一个轻量级的Python Web框架，符合 WSGI 的规范要求。它的最初版本只有 600 多行，相对便于理解。下面我们来看下它最初版本中关于 WSGI 接口的部分。

def wsgi_app(self, environ, start_response): """The actual WSGI application. This is not implemented in `__call__` so that middlewares can be applied: app.wsgi_app = MyMiddleware(app.wsgi_app) """ with self.request_context(environ): rv = self.preprocess_request() if rv is None: rv = self.dispatch_request() response = self.make_response(rv) response = self.process_response(response) return response(environ, start_response) def __call__(self, environ, start_response): """Shortcut for :attr:`wsgi_app`""" return self.wsgi_app(environ, start_response)

这里的 wsgi_app 实现了我们说的 application 功能，rv 是对请求的封装，response 是框架用来处理业务逻辑的具体函数。这里对 flask 源码不做过多解释，感兴趣的可以去github下载，然后check 到最初版本去查看。

中间件

前面 flask 代码 wsgi_app 函数的注释中提到不直接在 __call__ 中实现 application 部分，是为了可以使用中间件。那么为什么要使用中间件，中间件又是什么呢?

回顾前面的 application/server 端接口，对于一个 HTTP 请求，server 端总是会调用一个 application 来进行处理，并返回 application 处理后的结果。这足够应付一般的场景了，不过并不完善，考虑下面的几种应用场景：

对于不同的请求(比如不同的 URL)，server 需要调用不同的 application，那么如何选择调用哪个呢; 为了做负载均衡或者是远程处理，需要使用网络上其他主机上运行的 application 来做处理; 需要对 application 返回的内容做一定处理后才能作为 HTTP 响应;

上面这些场景有一个共同点就是，有一些必需的操作不管放在服务端还是应用(框架)端都不合适。对应用端来说，这些操作应该由服务器端来做，对服务器端来说，这些操作应该由应用端来做。为了处理这种情况，引入了中间件。

中间件就像是应用端和服务端的桥梁，来沟通两边。对服务器端来说，中间件表现的像是应用端，对应用端来说，它表现的像是服务器端。如下图所示：

中间件

中间件的实现

flask 框架在 Flask 类的初始化代码中就使用了中间件：

self.wsgi_app = SharedDataMiddleware(self.wsgi_app, { self.static_path: target })

这里的作用和 python 中的装饰器一样，就是在执行 self.wsgi_app 前后执行 SharedDataMiddleware 中的一些内容。中间件做的事，很类似python中装饰器做的事情。SharedDataMiddleware 中间件是 werkzeug 库提供的，用来支持站点托管静态内容。此外，还有DispatcherMiddleware 中间件，用来支持根据不同的请求，调用不同的 application，这样就可以解决前面场景 1, 2 中的问题了。

下面来看看 DispatcherMiddleware 的实现：

class DispatcherMiddleware(object): """Allows one to mount middlewares or applications in a WSGI application. This is useful if you want to combine multiple WSGI applications:: app = DispatcherMiddleware(app, { '/app2': app2, '/app3': app3 }) """ def __init__(self, app, mounts=None): self.app = app self.mounts = mounts or {} def __call__(self, environ, start_response): script = environ.get('PATH_INFO', '') path_info = '' while '/' in script: if script in self.mounts: app = self.mounts[script] break script, last_item = script.rsplit('/', 1) path_info = '/%s%s' % (last_item, path_info) else: app = self.mounts.get(script, self.app) original_script_name = environ.get('SCRIPT_NAME', '') environ['SCRIPT_NAME'] = original_script_name + script environ['PATH_INFO'] = path_info return app(environ, start_response)

初始化中间件时需要提供一个 mounts 字典，用来指定不同 URL 路径到 application 的映射关系。这样对于一个请求，中间件检查其路径，然后选择合适的 application 进行处理。

关于 WSGI 的原理部分基本结束，下一篇我会介绍下对 flask 框架的理解。

更多Python 搭建Web站点之Web服务器网关接口相关文章请关注PHP中文网！

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Python：自動化、スクリプト、およびタスク管理Apr 16, 2025 am 12:14 AM

Pythonは、自動化、スクリプト、およびタスク管理に優れています。 1）自動化：OSやShutilなどの標準ライブラリを介してファイルバックアップが実現されます。 2）スクリプトの書き込み：Psutilライブラリを使用してシステムリソースを監視します。 3）タスク管理：スケジュールライブラリを使用してタスクをスケジュールします。 Pythonの使いやすさと豊富なライブラリサポートにより、これらの分野で優先ツールになります。

Pythonと時間：勉強時間を最大限に活用するApr 14, 2025 am 12:02 AM

限られた時間でPythonの学習効率を最大化するには、PythonのDateTime、時間、およびスケジュールモジュールを使用できます。 1. DateTimeモジュールは、学習時間を記録および計画するために使用されます。 2。時間モジュールは、勉強と休息の時間を設定するのに役立ちます。 3.スケジュールモジュールは、毎週の学習タスクを自動的に配置します。

Python：ゲーム、GUIなどApr 13, 2025 am 12:14 AM

PythonはゲームとGUI開発に優れています。 1）ゲーム開発は、2Dゲームの作成に適した図面、オーディオ、その他の機能を提供し、Pygameを使用します。 2）GUI開発は、TKINTERまたはPYQTを選択できます。 TKINTERはシンプルで使いやすく、PYQTは豊富な機能を備えており、専門能力開発に適しています。

Python vs. C：比較されたアプリケーションとユースケースApr 12, 2025 am 12:01 AM

Pythonは、データサイエンス、Web開発、自動化タスクに適していますが、Cはシステムプログラミング、ゲーム開発、組み込みシステムに適しています。 Pythonは、そのシンプルさと強力なエコシステムで知られていますが、Cは高性能および基礎となる制御機能で知られています。

2時間のPython計画：現実的なアプローチApr 11, 2025 am 12:04 AM

2時間以内にPythonの基本的なプログラミングの概念とスキルを学ぶことができます。 1.変数とデータ型、2。マスターコントロールフロー（条件付きステートメントとループ）、3。機能の定義と使用を理解する4。

Python：主要なアプリケーションの調査Apr 10, 2025 am 09:41 AM

Pythonは、Web開発、データサイエンス、機械学習、自動化、スクリプトの分野で広く使用されています。 1）Web開発では、DjangoおよびFlask Frameworksが開発プロセスを簡素化します。 2）データサイエンスと機械学習の分野では、Numpy、Pandas、Scikit-Learn、Tensorflowライブラリが強力なサポートを提供します。 3）自動化とスクリプトの観点から、Pythonは自動テストやシステム管理などのタスクに適しています。

2時間でどのくらいのPythonを学ぶことができますか？Apr 09, 2025 pm 04:33 PM

2時間以内にPythonの基本を学ぶことができます。 1。変数とデータ型を学習します。2。ステートメントやループの場合などのマスター制御構造、3。関数の定義と使用を理解します。これらは、簡単なPythonプログラムの作成を開始するのに役立ちます。

プロジェクトの基本と問題駆動型の方法で10時間以内にコンピューター初心者プログラミングの基本を教える方法は？Apr 02, 2025 am 07:18 AM

10時間以内にコンピューター初心者プログラミングの基本を教える方法は？コンピューター初心者にプログラミングの知識を教えるのに10時間しかない場合、何を教えることを選びますか...

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、