ホームページ >バックエンド開発 >Python チュートリアル >Python を使用して XML 内の URL とリンクを解析する
タイトル: Python を使用して XML 内の URL とリンクを解析する
日々の開発作業では、XML ファイルのニーズから URL とリンクを抽出する必要に遭遇することがよくあります。この記事では、Python を使用して XML 内の URL とリンクを解析する方法と、対応するコード例を紹介します。
1. XML と解析ツールの紹介
XML (eXtensible Markup Language) は、データをマークするために使用される拡張可能なマークアップ言語であり、Web 開発やデータ対話などの分野で広く使用されています。 Python では、組み込みの xml.etree.ElementTree モジュールを使用して XML ファイルを解析できます。
2. 必要なモジュールのインポートと準備
開始する前に、必要なモジュールをインポートする必要があります。その中で、xml.etree.ElementTree は XML ファイルの解析に使用され、re モジュールは正規表現処理に使用されます。同時に、サンプル XML ファイルを準備する必要もあります。コードは次のとおりです。
import xml.etree.ElementTree as ET import re # 示例XML文件内容 xml_string = ''' <root> <item> <title>百度</title> <link>https://www.baidu.com</link> </item> <item> <title>谷歌</title> <link>https://www.google.com</link> </item> <item> <title>必应</title> <link>https://www.bing.com</link> </item> </root> '''
上の例では、3 つの item サブ要素を含む XML ルート ノードを作成し、 title および link サブ要素は削除されます。
3. XML ファイル内の URL とリンクを解析する
次に、XML ファイル内の URL とリンクの解析を開始します。 XML ファイルを解析する手順は次のとおりです。
ElementTree オブジェクトを作成し、ルート ノードを取得します
root = ET.fromstring(xml_string)
項目サブをトラバースします。ルート ノードの下の要素
for item in root.iter('item'):
title = item.find('title').text link = item.find('link').text#使用テキスト コンテンツが URL リンクであるかどうかを判断するための正規表現
is_link = re.match(r'^https?://(?:[-w.]|(?:%[da-fA-F]{2}))+$', link)
#タイトルとリンクを出力##
if is_link: print('标题:', title) print('链接:', link)
import xml.etree.ElementTree as ET import re xml_string = ''' <root> <item> <title>百度</title> <link>https://www.baidu.com</link> </item> <item> <title>谷歌</title> <link>https://www.google.com</link> </item> <item> <title>必应</title> <link>https://www.bing.com</link> </item> </root> ''' root = ET.fromstring(xml_string) for item in root.iter('item'): title = item.find('title').text link = item.find('link').text is_link = re.match(r'^https?://(?:[-w.]|(?:%[da-fA-F]{2}))+$', link) if is_link: print('标题:', title) print('链接:', link)
4. 実行して結果を出力します
上記のコードを実行すると、次の結果が得られます:标题: 百度 链接: https://www.baidu.com 标题: 谷歌 链接: https://www.google.com 标题: 必应 链接: https://www.bing.com
この記事では、Python を使用して XML 内の URL とリンクを解析する方法を紹介します。xml.etree.ElementTree モジュールを使用すると、XML ファイルを簡単に解析し、XML ファイル内の URL を抽出できます。 . とリンク。同時に、正規表現を使用してリンク上の簡単な形式検証も実行しました。この記事が実際の開発における XML 解析作業に役立つことを願っています。
以上がPython を使用して XML 内の URL とリンクを解析するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。