Python がリクエストを使用して Web ページをリクエストする方法-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Python がリクエストを使用して Web ページをリクエストする方法

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 25, 2023 am 09:29 AM

pythonrequests

Requests は urllib2 のすべての機能を継承します。

リクエストは、HTTP 接続の永続性と接続プーリングをサポートし、セッションを維持するための Cookie の使用をサポートし、ファイルのアップロードをサポートし、応答コンテンツのエンコードの自動決定をサポートし、国際化された URL と POST データの自動エンコードをサポートします。

インストール方法

pip を使用してインストール

$ pip install requests

GET リクエスト

基本的な GET リクエスト (ヘッダーパラメーターとパルマパラメーター)

1. 最も基本的な GET リクエストは、get メソッド '

response = requests.get("http://www.baidu.com/")
 
# 也可以这么写
# response = requests.request("get", "http://www.baidu.com/")

2. ヘッダーとクエリパラメーターを追加します

If ヘッダーを追加する場合は、headers パラメーターを渡して、リクエストヘッダーにヘッダー情報を追加できます。

URL でパラメータを渡したい場合は、params パラメータを使用できます。

import requests
 
kw = {&#39;wd&#39;:&#39;长城&#39;}
 
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}
 
# params 接收一个字典或者字符串的查询参数，字典类型自动转换为url编码，不需要urlencode()
response = requests.get("http://www.baidu.com/s?", params = kw, headers = headers)
 
# 查看响应内容，response.text 返回的是Unicode格式的数据
print (response.text)
 
# 查看响应内容，response.content返回的字节流数据
print (respones.content)
 
# 查看完整url地址
print (response.url)
 
# 查看响应头部字符编码
print (response.encoding)
 
# 查看响应码
print (response.status_code)

実行結果

....

....

'http://www.baidu .com/s?wd=Great Wall'

'utf-8'

200

response.text を使用する場合、リクエストはテキストに基づいて行われます。 HTTP 応答のエンコーディング応答コンテンツを自動的にデコードし、ほとんどの Unicode 文字セットをシームレスにデコードできます。

response.content を使用すると、サーバーの応答データの元のバイナリバイトストリームが返され、画像などのバイナリファイルの保存に使用できます。

POST メソッド

1. 基本的な POST リクエスト

response = requests.post("http://www.baidu.com/",data = data)

2.body パラメータ付き

formdata = {
    "type": "AUTO",
    "doctype": "json",
    "key": "www",
    "ue": "UTF-8",
}
url = "http://auto-installment/v1/loan-credit-check"
response = requests.post(url,data = data,headers=headers)
 
print(response.text)#显示返回结果
print(response.json())# 如果是json文件可以直接显示

注:

印刷結果は中国語で文字化けして表示されます。この問題を解決するには、json.dupms(response, ensure_ascii=False)) を使用してください。

Session

一般に、セッションを使用してクロスします。 -request 他のページにアクセスする前にログインするなど、特定のパラメータを常に維持してください

# 1. 创建session对象，可以保存Cookie值
session = requests.session()
 
# 2. 需要登录的用户名和密码
data = {"username": "mxxxx", "password": "1233444"}
 
# 3. 发送附带用户名和密码的请求，并获取登录后的Cookie值，保存在ssion里
session.post("https://www.jianshu.com/sign_in", data=data)
 
# 4. ssion包含用户登录后的Cookie值，可以直接访问那些登录后才可以访问的页面
response = session.get("https://www.jianshu.com/writer#/")

落とし穴に関する注意

1. リクエストを使用してインターフェイスを要求すると、エラーが発生します。しかし、インターフェース自体には問題はありません。 これは、インターフェイスには単純なタイプ (通常は 3 つ未満) と複雑なオブジェクトタイプという 2 つのタイプのリクエストパラメータがあるためです。

解決策: ヘッダーでこれら 2 つのパラメーターの型を定義します。

単純な型: headers={"Content-Type": "application/x-www-form-urlencoded"}

複雑なオブジェクトタイプ: headers={"Content-Type":application/json}

2。一部の HTTPS リクエストには SSL 証明書検証が含まれています

解決策: 応答= request.get("https://www.baidu.com/", verify=False)

Extension

1.リクエストが失敗した後、再試行メカニズムを追加します (失敗した場合は 3 回再試行されます)

request_retry = requests.adapatrs.HTTPAdapaters(max_retries=3）
session.mount(&#39;https://&#39;,request_retry)

2. grequests を使用して非同期リクエストを実装します

urls = [
    &#39;http://www.url1.com&#39;,
    &#39;http://www.url2.com&#39;,
    &#39;http://www.url3.com&#39;,
    &#39;http://www.url4.com&#39;,
    &#39;http://www.url5.com&#39;,
]
resp = (grequests.get(u) for u in urls)
grequests.map(resp)

3. カスタム cookie

セッションインスタンスを使用してリクエスト間で Cookie を保持しますが、特殊なケースではカスタム Cookie を使用する必要があります。

セッションインスタンスを使用してリクエスト間で Cookie を保持します。場合には、カスタム Cookie を使用する必要があります

# 自定义cookies
cookie = {&#39;guid&#39;:&#39;5BF0FAB4-A7CF-463E-8C17-C1576fc7a9a8&#39;,&#39;uuid&#39;:&#39;3ff5f4091f35a467&#39;}
 
session.post(&#39;http://&#39;, cookies=cookie)

4. API リクエストにかかった時間をカウントします

session.get(url).elapsed.total_seconds()

5. リクエストのタイムアウトを設定します

session.get(url, timeout=15)

6. ファイルのアップロード

リクエストは、ファイルデータの送信をシミュレートするパラメータとしてファイルを使用します

file = {&#39;file&#39;:open(&#39;test.bmp&#39;,&#39;rb&#39;)}   #rb表示用二进制格式打开指定目录下的文件，且用于只读
r =requests.post(&#39;http://&#39;,files=file)
print(r.text)

以上がPython がリクエストを使用して Web ページをリクエストする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は亿速云で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Pythonの主な目的：柔軟性と使いやすさApr 17, 2025 am 12:14 AM

Pythonの柔軟性は、マルチパラダイムサポートと動的タイプシステムに反映されていますが、使いやすさはシンプルな構文とリッチ標準ライブラリに由来しています。 1。柔軟性：オブジェクト指向、機能的および手続き的プログラミングをサポートし、動的タイプシステムは開発効率を向上させます。 2。使いやすさ：文法は自然言語に近く、標準的なライブラリは幅広い機能をカバーし、開発プロセスを簡素化します。

Python：汎用性の高いプログラミングの力Apr 17, 2025 am 12:09 AM

Pythonは、初心者から上級開発者までのすべてのニーズに適した、そのシンプルさとパワーに非常に好まれています。その汎用性は、次のことに反映されています。1）学習と使用が簡単、シンプルな構文。 2）Numpy、Pandasなどの豊富なライブラリとフレームワーク。 3）さまざまなオペレーティングシステムで実行できるクロスプラットフォームサポート。 4）作業効率を向上させるためのスクリプトおよび自動化タスクに適しています。

1日2時間でPythonを学ぶ：実用的なガイドApr 17, 2025 am 12:05 AM

はい、1日2時間でPythonを学びます。 1.合理的な学習計画を作成します。2。適切な学習リソースを選択します。3。実践を通じて学んだ知識を統合します。これらの手順は、短時間でPythonをマスターするのに役立ちます。

Python vs. C：開発者の長所と短所Apr 17, 2025 am 12:04 AM

Pythonは迅速な開発とデータ処理に適していますが、Cは高性能および基礎となる制御に適しています。 1）Pythonは、簡潔な構文を備えた使いやすく、データサイエンスやWeb開発に適しています。 2）Cは高性能で正確な制御を持ち、ゲームやシステムのプログラミングでよく使用されます。

Python：時間のコミットメントと学習ペースApr 17, 2025 am 12:03 AM

Pythonを学ぶのに必要な時間は、人によって異なり、主に以前のプログラミングの経験、学習の動機付け、学習リソースと方法、学習リズムの影響を受けます。現実的な学習目標を設定し、実用的なプロジェクトを通じて最善を尽くします。

Python：自動化、スクリプト、およびタスク管理Apr 16, 2025 am 12:14 AM

Pythonは、自動化、スクリプト、およびタスク管理に優れています。 1）自動化：OSやShutilなどの標準ライブラリを介してファイルバックアップが実現されます。 2）スクリプトの書き込み：Psutilライブラリを使用してシステムリソースを監視します。 3）タスク管理：スケジュールライブラリを使用してタスクをスケジュールします。 Pythonの使いやすさと豊富なライブラリサポートにより、これらの分野で優先ツールになります。

Pythonと時間：勉強時間を最大限に活用するApr 14, 2025 am 12:02 AM

限られた時間でPythonの学習効率を最大化するには、PythonのDateTime、時間、およびスケジュールモジュールを使用できます。 1. DateTimeモジュールは、学習時間を記録および計画するために使用されます。 2。時間モジュールは、勉強と休息の時間を設定するのに役立ちます。 3.スケジュールモジュールは、毎週の学習タスクを自動的に配置します。

Python：ゲーム、GUIなどApr 13, 2025 am 12:14 AM

PythonはゲームとGUI開発に優れています。 1）ゲーム開発は、2Dゲームの作成に適した図面、オーディオ、その他の機能を提供し、Pygameを使用します。 2）GUI開発は、TKINTERまたはPYQTを選択できます。 TKINTERはシンプルで使いやすく、PYQTは豊富な機能を備えており、専門能力開発に適しています。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、