Request と BeautifulSoup は、オンラインで任意のファイルまたは PDF をダウンロードできる Python ライブラリです。リクエスト ライブラリは、HTTP リクエストの送信と応答の受信に使用されます。 BeautifulSoup ライブラリは、応答で受け取った HTML を解析し、ダウンロード可能な PDF リンクを取得するために使用されます。この記事では、Python で Request と Beautiful Soup を使用して PDF をダウンロードする方法を学びます。
BeautifulSoup ライブラリと Request ライブラリを Python で使用する前に、pip コマンドを使用してこれらのライブラリをシステムにインストールする必要があります。 request、BeautifulSoup および Request ライブラリをインストールするには、ターミナルで次のコマンドを実行します。
リーリーインターネットから PDF をダウンロードするには、まずリクエスト ライブラリを使用して PDF ファイルの URL を見つける必要があります。次に、Beautiful Soup を使用して HTML 応答を解析し、PDF ファイルへのリンクを抽出します。ベース URL と解析後に受け取った PDF リンクが結合されて、PDF ファイルの URL が取得されます。これで、request メソッドを使用して Get リクエストを送信し、ファイルをダウンロードできるようになります。
###例###以上がPython のリクエストと BeautifulSoup を使用して PDF ファイルをダウンロードするの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。