Web ページからコンテンツを抽出するために正規表現を使用するのは非常に面倒です。これは、HTML または XML ファイルからデータを抽出できる Python ライブラリです。これは、お気に入りのコンバーターを使用して、慣例的なドキュメント ナビゲーションと検索を実現できます。 Beautiful Soup を使用すると、数時間または数日の作業を節約できます。 Beautiful Soup 4.2.0 ドキュメント
具体的なアプリケーションについては公式ドキュメントで明確に説明されているため、ここでは詳しく説明しません。インストール中に遭遇した問題についてお話します。
1. python3 をインストールします
公式 Web サイトから python3 をダウンロードしてインストールし、インストールされた python.exe の名前を python3.exe に変更します
2. pip3 をインストールします
入力: >pip3
問題プロンプト:ランチャーの致命的なエラー: 「」を使用してプロセスを作成できません
入力: >python3 -m pip install --upgrade pip
質問プロンプト: 要件はすでに最新です: pip in c:users****appdatalocalprogramspythonpython36- 32libsite-packages
入力: >python3 -m pip install --upgrade pip --force-reinstall
出力:
入力: >pip3 -V
出力: c:users からの pip 9.0.1 ** **appdatalocalprogramspythonpython36-32libsite-packages (python 3.6)
pip3 インストール完了
3. BeautifulSoup4 をインストール
>pip3 install beautifulsoup4
ソースコード付きでインストールしたい場合は、BS4 のソースコードをダウンロードし、次に、setup.py を通じてインストールします。
ダウンロードした圧縮パッケージをローカルで抽出し、次のコマンドを使用して Python3 コードに変換します。
2to3.py を含む Python インストール ディレクトリに Toolsscripts を入力し、コマンドを使用して変換します
Python36 -32Toolsscripts>python 2to3.py -w C:Users****AppDataLocalProgramsPythonPython36-32Beautifulsoup4-4.6.0
コマンド プロンプトを使用して BS4 の解凍されたディレクトリに入り、インストールを開始します:
>python setup.py install
4. パーサーをインストールします:
>pip3 install lxml
>pip3 install html5lib
インターネット上には BeautifulSoup3 と Python2 のコードがたくさんあります。与えられたデモに対してテストするとさまざまな問題が発生します。新しい内容を学習する場合は、公式ドキュメントを直接参照してください
。以上がPython3+BeautifulSoup4 インストール例チュートリアルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。