PythonとXMLを組み合わせる実践的なチュートリアル-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

PythonとXMLを組み合わせる実践的なチュートリアル

php中世界最好的语言

Apr 09, 2018 pm 02:34 PM

pythonチュートリアル組み合わせる

今回は、Python と XML を組み合わせるための実践的なチュートリアルをお届けします。Python と XML を組み合わせる際の注意事項は何ですか?実際の事例を見てみましょう。

このプロジェクトの名前はユニバーサルXMLとは呼ばれず、XMLファイルを元に

ディレクトリ構造に対応したWebサイトを生成するという方が適切ですが、HTMLだけではあまりにも単純です。 CSSも生成できればもっと良いでしょう。これは今後開発する必要があります。まず HTML ウェブサイトの構造を勉強しましょう。 Web サイトは XML 構造を通じて生成されるため、すべてがこの XML ファイルから取得される必要があります。まず、この XML ファイル、website.xml を見てみましょう:

<website>
 <page>
 <h1 id="Welcome-to-my-Home-page">Welcome to my Home page</h1>
 <p>Hi, there. My name is Mr.gumby,and this is my home page,here are some of my int:</p>
 <ul>
  <li><a>Shouting</a></li>
  <li><a>Sleeping</a></li>
  <li><a>Eating</a></li>
 </ul>
 </page>
 <directory>
  <page>
   <h1 id="shouting-page">shouting page</h1>
   <p>....</p>
  </page>
  <page>
   <h1 id="sleeping-page">sleeping page</h1>
   <p>...</p>
  </page>
  <page>
    <h1 id="Eating-page">Eating page</h1>
    <p>....</p>
  </page>
 </directory>
</website>

このファイルを使用して、このファイルを通じて Web サイトを生成する方法を見てみましょう。

まず、この XML ファイルを解析する必要があります。Python は Java と同じように XML を解析します。2 つの処理方法の違いは速度とスコープです。前者は効率を重視し、ドキュメントのみを処理します。後者は、最初にすべてのドキュメントをメモリにロードしてから処理するため、メモリを迅速かつ効率的に利用できます。唯一の利点は、処理が遅くなり、より多くのメモリを消費することです。ドキュメント全体を操作できるということです。

sax を使用して Python で XML を処理するには、まず xml.sax に parse 関数を導入し、xml.sax.handler に ContentHandler を導入する必要があります。後者のクラスは parse 関数と組み合わせて使用する必要があります。使用方法は次のとおりです: parse('xxx.xml',xxxHandler)、ここの xxxHandler は上記の ContentHandler を継承する必要がありますが、継承するだけで何もする必要はありません。次に、parse 関数が XML ファイルを処理するときに、xxxHandler の startElement 関数と endElement 関数を呼び出して、xml 内のタグを開始および終了します。中間のプロセスでは、characters という名前の関数を使用して、タグ内のすべての文字列を処理します。

上記の理解により、xml ファイルを処理する方法がすでにわかりました。次に、悪の根源である website.xml ファイルを見て、その構造を分析します。ページとディレクトリの 2 つのノードしかないことは明らかです。 page はページを表します。

それで、この XML ファイルを処理するアイデアが明確になります。 XML ファイルの各ノードを読み取り、それがページであるかディレクトリであるかを判断し、ページである場合は HTML ページを作成し、ノードの内容をファイルに書き込みます。ディレクトリが見つかった場合は、フォルダーを作成し、その中にあるページノード (存在する場合) を処理します。

コードのこの部分を見てみましょう。この本の実装はより複雑で柔軟です。まずはそれを見てから分析しましょう。

from xml.sax.handler import ContentHandler
from xml.sax import parse
import os
class Dispatcher:
    def dispatch(self, prefix, name, attrs=None):
        mname = prefix + name.capitalize()
        dname = 'default' + prefix.capitalize()
        method = getattr(self, mname, None)
        if callable(method): args = ()
        else:
            method = getattr(self, dname, None)
            args = name,
        if prefix == 'start': args += attrs,
        if callable(method): method(*args)
    def startElement(self, name, attrs):
        self.dispatch('start', name, attrs)
    def endElement(self, name):
        self.dispatch('end', name)
class WebsiteConstructor(Dispatcher, ContentHandler):
    passthrough = False
    def init(self, directory):
        self.directory = [directory]
        self.ensureDirectory()
    def ensureDirectory(self):
        path = os.path.join(*self.directory)
        print path
        print '----'
        if not os.path.isdir(path): os.makedirs(path)
    def characters(self, chars):
        if self.passthrough: self.out.write(chars)
    def defaultStart(self, name, attrs):
        if self.passthrough:
            self.out.write('')
    def defaultEnd(self, name):
        if self.passthrough:
            self.out.write('%s>' % name)
    def startDirectory(self, attrs):
        self.directory.append(attrs['name'])
        self.ensureDirectory()
    def endDirectory(self):
        print 'endDirectory'
        self.directory.pop()
    def startPage(self, attrs):
        print 'startPage'
        filename = os.path.join(*self.directory + [attrs['name']+'.html'])
        self.out = open(filename, 'w')
        self.writeHeader(attrs['title'])
        self.passthrough = True
    def endPage(self):
        print 'endPage'
        self.passthrough = False
        self.writeFooter()
        self.out.close()
    def writeHeader(self, title):
        self.out.write('\n \n  <title>')
        self.out.write(title)
        self.out.write('</title>\n \n \n')
    def writeFooter(self):
        self.out.write('\n \n\n')
parse('website.xml',WebsiteConstructor('public_html'))

このプログラムの分析はもう少し複雑なようですが、偉人猫猫は、どんな複雑なプログラムも張り子の虎だと言いました。それでは、このプログラムをもう一度分析してみましょう。

まず、このプログラムには 2 つのクラスがあることがわかりますが、実際には継承により 1 つのクラスと見なすことができます。

次に、分析した startElement、endElement、文字に加えて、startPage、endDirectory、writeHeader、writeFooter、dispatch などの追加の関数があることを見てみましょう。ディスパッチを除いて、前述の関数の各ペアは、対応する

html タグと XML ノードを単純に処理します。ディスパッチの複雑さは、関数を動的に組み合わせて実行するために使用されることです。

dispatchの処理の考え方は、まず渡されたパラメータ(つまりオペレーション名とノード名)を元にstartPageなどの対応する関数があるかどうかを判断し、存在しない場合はdefault+オペレーション名を実行します。 :defaultStart など。

各機能を一つ一つ理解すると、全体の処理の流れが分かります。まず、Web サイト全体を保存する public_html ファイルを作成し、次に XML ノードを読み取り、startElement と endElement を通じてディスパッチを呼び出して処理します。次に、dispatch が特定の処理関数を呼び出す方法について説明します。この時点で、このプロジェクトの分析は完了しました。

マスターする主な内容は、Python で XML を処理するための SAX の使用であり、もう 1 つは、パラメーターを渡す際の getattr やアスタリスクなどの Python の関数の使用です...

以降の方法はマスターできたと思います。この記事の事例などを読んでみてください。とても興味深いですね。php 中国語 Web サイトの他の関連記事にも注目してください。

推奨書籍:

Python でデータフレーム内のデータをデータベースに書き込む方法

Python レプリケーションでオブジェクトのライフサイクルを使用する方法

以上がPythonとXMLを組み合わせる実践的なチュートリアルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Python vs. C：曲線と使いやすさの学習Apr 19, 2025 am 12:20 AM

Pythonは学習と使用が簡単ですが、Cはより強力ですが複雑です。 1。Python構文は簡潔で初心者に適しています。動的なタイピングと自動メモリ管理により、使いやすくなりますが、ランタイムエラーを引き起こす可能性があります。 2.Cは、高性能アプリケーションに適した低レベルの制御と高度な機能を提供しますが、学習しきい値が高く、手動メモリとタイプの安全管理が必要です。

Python vs. C：メモリ管理とコントロールApr 19, 2025 am 12:17 AM

PythonとCは、メモリ管理と制御に大きな違いがあります。 1。Pythonは、参照カウントとガベージコレクションに基づいて自動メモリ管理を使用し、プログラマーの作業を簡素化します。 2.Cには、メモリの手動管理が必要であり、より多くの制御を提供しますが、複雑さとエラーのリスクが増加します。どの言語を選択するかは、プロジェクトの要件とチームテクノロジースタックに基づいている必要があります。

科学コンピューティングのためのPython：詳細な外観Apr 19, 2025 am 12:15 AM

科学コンピューティングにおけるPythonのアプリケーションには、データ分析、機械学習、数値シミュレーション、視覚化が含まれます。 1.numpyは、効率的な多次元配列と数学的関数を提供します。 2。ScipyはNumpy機能を拡張し、最適化と線形代数ツールを提供します。 3. Pandasは、データ処理と分析に使用されます。 4.matplotlibは、さまざまなグラフと視覚的な結果を生成するために使用されます。

PythonとC：適切なツールを見つけるApr 19, 2025 am 12:04 AM

PythonまたはCを選択するかどうかは、プロジェクトの要件に依存するかどうかは次のとおりです。1）Pythonは、簡潔な構文とリッチライブラリのため、迅速な発展、データサイエンス、スクリプトに適しています。 2）Cは、コンピレーションと手動メモリ管理のため、システムプログラミングやゲーム開発など、高性能および基礎となる制御を必要とするシナリオに適しています。

データサイエンスと機械学習のためのPythonApr 19, 2025 am 12:02 AM

Pythonは、データサイエンスと機械学習で広く使用されており、主にそのシンプルさと強力なライブラリエコシステムに依存しています。 1）Pandasはデータ処理と分析に使用され、2）Numpyが効率的な数値計算を提供し、3）SCIKIT-LEARNは機械学習モデルの構築と最適化に使用されます。これらのライブラリは、Pythonをデータサイエンスと機械学習に理想的なツールにします。

Pythonの学習：2時間の毎日の研究で十分ですか？Apr 18, 2025 am 12:22 AM

Pythonを1日2時間学ぶだけで十分ですか？それはあなたの目標と学習方法に依存します。 1）明確な学習計画を策定し、2）適切な学習リソースと方法を選択します。3）実践的な実践とレビューとレビューと統合を練習および統合し、統合すると、この期間中にPythonの基本的な知識と高度な機能を徐々に習得できます。

Web開発用のPython：主要なアプリケーションApr 18, 2025 am 12:20 AM

Web開発におけるPythonの主要なアプリケーションには、DjangoおよびFlaskフレームワークの使用、API開発、データ分析と視覚化、機械学習とAI、およびパフォーマンスの最適化が含まれます。 1。DjangoandFlask Framework：Djangoは、複雑な用途の迅速な発展に適しており、Flaskは小規模または高度にカスタマイズされたプロジェクトに適しています。 2。API開発：フラスコまたはdjangorestFrameworkを使用して、Restfulapiを構築します。 3。データ分析と視覚化：Pythonを使用してデータを処理し、Webインターフェイスを介して表示します。 4。機械学習とAI：Pythonは、インテリジェントWebアプリケーションを構築するために使用されます。 5。パフォーマンスの最適化：非同期プログラミング、キャッシュ、コードを通じて最適化

Python vs. C：パフォーマンスと効率の探索Apr 18, 2025 am 12:20 AM

Pythonは開発効率でCよりも優れていますが、Cは実行パフォーマンスが高くなっています。 1。Pythonの簡潔な構文とリッチライブラリは、開発効率を向上させます。 2.Cのコンピレーションタイプの特性とハードウェア制御により、実行パフォーマンスが向上します。選択を行うときは、プロジェクトのニーズに基づいて開発速度と実行効率を比較検討する必要があります。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 中国語版

中国語版、とても使いやすい

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ドリームウィーバー CS6

ビジュアル Web 開発ツール

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。