ホームページ  >  記事  >  バックエンド開発  >  自動テスト: Python のいくつかの一般的なプログラミング パターン

自動テスト: Python のいくつかの一般的なプログラミング パターン

王林
王林転載
2023-04-13 21:04:012802ブラウズ

自動テスト: Python のいくつかの一般的なプログラミング パターン

この章では、主に Python にはどのようなプログラミング モードがあるのか​​を理解し、Python の基本的な構文を習得し、理解できるようにするために、「Python の構文仕様とデータ型」に関する内容を更新します。コマンドラインパラメータの出力方法と基本的な応用 Python のデータ型を理解すると、さらに関連した操作を実行できるようになります。

一般的なプログラミング パターン

①Python 対話型コマンド プログラミング。

②Pythonスクリプトプログラミング。

③中国語のエンコード処理。

1. 対話型コマンド プログラミング モード

対話型コマンド プログラミング モードは、典型的な 1 行ずつの読み取り実行モードです。

このプログラミング モードは、プログラムが 1 行以下の場合の一般的なアプリケーションです。

次の図では、プログラミングに PythonIDLE エディターを使用しています。このエディターのプログラミング モードは、典型的な対話型コマンド エンコーディング シンボルです。

#>>>> は、対話型コマンドを入力するためのプロンプトです。入力完了後に Enter キーを押すたびに、Python パーサーによってコマンドが実行されます。

自動テスト: Python のいくつかの一般的なプログラミング パターン

2. スクリプト プログラミング モード

コードのより複雑または大規模なセクションを記述する必要がある場合、命令型プログラミングは十分便利ではありません。

したがって、Python はスクリプト プログラミング モードを提供します。接尾辞 *.py が付いたスクリプト ファイルを作成し、そのファイルに大量のコードを書き込むと、コードのメンテナンスと更新が容易になり、対話型コマンドまたは IDE ツールを使用して実行できます。

自動テスト: Python のいくつかの一般的なプログラミング パターン#3. 文字プログラミング

String はデータ型です。ただし、文字列には特殊なエンコードの問題があります。

コンピュータは数値のみを処理できるため、テキストを処理する場合は、処理する前にまずテキストを数値に変換する必要があります。

補足: 文字エンコーディングの開発の歴史

初期のコンピュータでは、設計時に 1 バイトとして 8 ビットが使用されていたため、1 バイトで表現できる最大の整数は 255 (2 進数) になります。 11111111 = 10 進数の 255)、より大きな整数を表現したい場合は、より多くのバイトを使用する必要があります。たとえば、2 バイトで表現できる最大整数は 65535、4 バイトで表現できる最大整数は 4294967295 です。

コンピューターはアメリカ人によって発明されて以来、最初にコンピューターにエンコードされたのは、英語の大文字と小文字、数字、および一部の記号の 127 文字だけでした。このエンコード テーブルは ASCII エンコードと呼ばれます。文字 文字 A のコードは 65、小文字 z のコードは 122 です。

自動テスト: Python のいくつかの一般的なプログラミング パターン拡張機能: unicode 文字セット

Python3 が中国語の文字化け問題をうまく解決できる理由は、Python3 がすべての文字列の文字エンコーディングに Unicode を使用しているためです。

##● Unicode は、文字化けを防ぐために、すべての言語を 1 つのコード セットに統一します。

# Unicode も絶えず開発されていますが、最も一般的に使用されるのは 2 バイトを使用して文字を表すことです (非常にまれな文字に遭遇した場合は 4 バイトが必要です)。現在、ほとんどのオペレーティング システムとほとんどのプログラミング言語が Unicode をサポートしています。

ASCII エンコードは 1 バイトですが、Unicode エンコードは通常 2 バイトです。

拡張子: UTF-8 文字セット

また新たな問題が発生:

Unicode エンコーディングに統一されれば、コード化けの問題は解消されます。ただし、作成するテキストが基本的にすべて英語の場合、Unicode エンコードは ASCII エンコードの 2 倍のストレージ容量を必要とし、ストレージと送信の点で非常に不経済です。

ソリューションの誕生:

Unicode エンコードを「可変長エンコード」に変換する UTF-8 エンコードが再び登場しました。

#UTF-8 エンコーディングは、Unicode 文字をさまざまな数値サイズに応じて 1 ~ 6 バイトにエンコードします。一般的に使用される英語の文字は 1 バイトにエンコードされ、中国語の文字は通常 3 バイトにエンコードされます。非常にまれな文字のみがエンコードされます。 4 ~ 6 バイトにエンコードされます。

# 送信するテキストに英語の文字が多数含まれている場合は、UTF-8 エンコードを使用するとスペースを節約できます。

# UTF-8 エンコードには追加の利点があります。つまり、ASCII エンコードは実際には UTF-8 エンコードの一部と見なすことができるため、ASCII エンコードのみをサポートする多数の歴史的なレガシー ソフトウェアをエンコードできます。 UTF-8 でコーディングしながら作業を続けます。

特記事項:

Unicode エンコードは、コンピューターのメモリ内で均一に使用されます。

python3 文字エンコーディング

Python3 バージョンでは、文字列は Unicode でエンコードされます。つまり、Python 文字列は複数の言語をサポートします。

単一文字のエンコーディングの場合、Python は単一文字の 10 進整数表現を取得する ord() 関数と、エンコーディングを対応する文字に変換する chr() 関数を提供します。

例:

>>> ord(‘A’)
65
>>> ord(‘中’)
20013
>>> chr(66)
‘B’
>>> chr(25991)
‘文’

Python ソース コードもテキスト ファイルであるため、ソース コードに中国語が含まれている場合は、ソース コードを保存するときに UTF-8 エンコードを指定する必要があります。 Python インタープリターがソース コードを読み取るとき、UTF-8 エンコーディングで読み取れるようにするために、通常はファイルの先頭にこの行を書き込みます。

#-*- coding:utf-8 *-

コメントは、Python インタプリタに UTF-8 エンコーディングに従ってソース コードを読み取るように指示するものです。そうしないと、ソース コードに記述した中国語出力が文字化けする可能性があります。

以上が自動テスト: Python のいくつかの一般的なプログラミング パターンの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。