この記事では主に、Python による XML ファイル解析の実装アイデアを紹介します。
XML ファイルの解析
解析のアイデア:
1.DOM 解析、SAX 解析、ET 解析 (要素ツリー)
まず、W3C DOM API の実装である xml.dom.* モジュールです。DOMAPI を処理する必要がある場合、このモジュールは非常に適しています。
2 番目、それは xml.sax です。 *モジュール。SAX API の実装です。このモジュールは、速度とメモリ使用量のために利便性を犠牲にしています。SAX はイベントベースの API です。つまり、大量のドキュメントを処理できます。 air" をメモリに完全にロードせずに実行します;
3 番目に、軽量の Python スタイル API を提供する xml.etree.ElementTree モジュール (略して ET) です。DOM と比較すると、ET ははるかに高速で、多くのコマンドを使用できる 快適な API が使用できる SAX と比較して、ET の ET.iterparse は「オンザエア」処理方式も提供します ドキュメント全体をメモリにロードする必要はありません 平均的なパフォーマンスは ET と同等ですSAX に似ていますが、API の効率は少し高く、使いやすいです。
2.1 xml.dom.*
ドキュメント オブジェクト モデル (DOM) は、拡張可能なマークアップ言語を処理するために W3C 組織によって推奨されている標準プログラミング インターフェイスです。 DOM パーサーが XML ドキュメントを解析するとき、ドキュメント全体を一度に読み取り、ドキュメント内のすべての要素をメモリ内のツリー構造に保存します。その後、DOM が提供するさまざまな関数を使用してドキュメントを読み取りまたは変更できます。コンテンツと構造を XML ファイルに書き込むこともできます。 XML ファイルを解析するには、Python で xml.dom.minidom を使用します。
2.2 xml.etree.ElementTree
ElementTree は XML を処理するために生まれました。Python 標準ライブラリには 2 つの実装があります:
1. xml などの純粋な Python 実装.etree.ElementTree,
Second, it is the fast xml.etree.cElementTree. Python 3.3 以降、ElementTree モジュールは利用可能な C ライブラリを自動的に検索してプロセスを高速化します。
以上がPython は XML ファイルを解析しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。