ホームページ >バックエンド開発 >Python チュートリアル >PythonでHTMLファイルのコンテンツをクリアする方法

PythonでHTMLファイルのコンテンツをクリアする方法

coldplay.xixi
coldplay.xixiオリジナル
2021-02-20 14:20:072894ブラウズ

Python で HTML ファイルのコンテンツをクリアする方法: 1. join メソッドを使用します。コードは [pat = re.compile('>(.*?)<')''.join です。 (pat.findall (test))]; 2. コンパイルメソッドを使用します。

PythonでHTMLファイルのコンテンツをクリアする方法

このチュートリアルの動作環境: Windows 7 システム、Python バージョン 3.9、DELL G3 コンピューターこの方法は、すべてのブランドのコンピューターに適しています。

HTML ファイルのコンテンツをクリアする Python メソッド:

方法 1:

In [97]: str_ = &#39;&#39;
    ...: flag = 1
    ...: for ele in test:
    ...:     if ele == "<":
    ...:         flag = 0
    ...:     elif ele == &#39;>&#39;:
    ...:         flag = 1
    ...:         continue
    ...:     if flag == 1:
    ...:         str_ += ele
    ...:         
In [98]: str_
Out[98]: &#39;just for testjust for testtest&#39;
In [99]: str_ = &#39;&#39;
    ...: flag = 1
    ...: for ele in test:
    ...:     if ele == "<":
    ...:         flag = 0
    ...:     elif ele == &#39;>&#39;:
    ...:         flag = 1
    ...:         ele = &#39; &#39;
    ...:     if flag == 1:
    ...:         str_ += ele
    ...:         
In [100]: str_
Out[100]: &#39; just for test   just for test  test &#39;

方法 2:

import re
In [156]: pat = re.compile(&#39;(?<=\>).*?(?=\<)&#39;)
In [157]: pat.findall(test)
Out[157]: [&#39;just for test&#39;, &#39;&#39;, &#39;&#39;, &#39;just for test&#39;, &#39;&#39;, &#39;test&#39;]
In [158]: &#39;&#39;.join(pat.findall(test))
Out[158]: &#39;just for testjust for testtest&#39;

方法 3 :

pat = re.compile(&#39;>(.*?)<&#39;)
&#39;&#39;.join(pat.findall(test))

方法 4:

In [167]: pat = re.compile(&#39;<[^>]+>&#39;, re.S)
In [168]: pat.sub(&#39;&#39;, test)
Out[168]: &#39;just for testjust for testtest&#39;

無料の学習に関する推奨事項が多数あります。Python チュートリアル## をご覧ください。 ### #(ビデオ)#########

以上がPythonでHTMLファイルのコンテンツをクリアする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。