ホームページ >バックエンド開発 >Python チュートリアル >Python は Baidu 翻訳をクロールします (json を使用してデータを抽出します)
この記事の内容は、Python による Baidu 翻訳のクローリング (json を使用してデータを抽出する) に関するもので、一定の参考価値があります。必要な友人は参考にしてください。お役に立てれば幸いです。
ツール: Python 3.6.5、PyCharm 開発ツール、Windows 10 オペレーティング システム
説明: この例は、入力中国語の英語への翻訳を実装する小さなプログラムで、Python クローラーの初心者に適しています。一緒に学びましょう、興味のある方は単語クエリ機能などの英語から中国語への翻訳機能をご利用いただけます。要素を検査するには、Google Chrome または Firefox を使用することをお勧めします。使用する前にモジュールをインストールする必要があります: pip インストールリクエスト pip install json。
データ抽出方法: json
1. データ交換形式、Python 型の文字列 (リスト、辞書) のように見えます
2. json を使用する前にインポートする必要があります
3.json.loads
# (1). json文字列をPython型に変換## (2).json.loads(json string)
#4 . json.dumps (1) Python 型を json 文字列に変換します (2) json.dumps({}) (3 ), json.dumps(ret1 、ensure_ascii=False,indent=2) ensure_ascii により中国語を中国語として表示できるようになります インデント: 前の行に基づいて次の行の間隔を空けることができますコード:
import requests import json url = "https://fanyi.baidu.com/basetrans" query_str = input("请输入要翻译的中文:") data = { "query":query_str, "from":"zh", "to":"en"} headers = { "User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1", "Referer": "https://fanyi.baidu.com/?aldtype=16047&tpltype=sigma" } response = requests.post(url,data=data,headers=headers) html_str = response.content.decode()#json字符串 #json数据交换格式,使用json之前需要导入 #把json字符串转化为Python类型 dict_ret = json.loads(html_str) #print(dict_ret) #print(type(dict_ret)) ret = dict_ret["trans"][0]["dst"] print("翻译结果是:",ret)
ランニング効果
:以上がPython は Baidu 翻訳をクロールします (json を使用してデータを抽出します)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。