>  기사  >  백엔드 개발  >  Python은 Baidu Translation을 크롤링합니다(json을 사용하여 데이터 추출).

Python은 Baidu Translation을 크롤링합니다(json을 사용하여 데이터 추출).

不言
不言앞으로
2018-09-28 14:57:045407검색

이 기사의 내용은 Python 크롤링 Baidu 번역(json을 사용하여 데이터 추출)에 대한 내용입니다. 필요한 친구가 참고할 수 있기를 바랍니다.

도구: Python 3.6.5, PyCharm 개발 도구, Windows 10 운영 체제

지침: 이 예제는 입력된 중국어를 영어로 번역하는 작은 프로그램입니다. 관심 있는 Python 크롤러 초보자가 함께 배우기에 적합합니다. 단어 쿼리 기능 등 중국어 기능에 대해 영어 번역을 할 수 있습니다. 요소를 검사하려면 Google Chrome 또는 Firefox를 사용하는 것이 좋습니다. 사용하기 전에 모듈을 설치해야 합니다: pip 설치 요청 pip install json.

데이터 추출 방법: json

1. 데이터 교환 형식, Python 형식의 문자열(목록, 사전)

2. json을 사용하기 전에 가져와야 합니다

3. json 문자열을 Python 유형으로 변환

    (2), json.loads(json string)

4, json.dumps

     (1), Python 유형을 json 문자열로 변환

  (2), json .dumps({} )

   (3), json.dumps(ret1, verify_ascii=False,indent=2)

   verify_ascii를 사용하면 중국어를 중국어로 표시할 수 있습니다

   들여쓰기: 이전 줄을 기반으로 다음 줄에 공백이 있게 할 수 있습니다

Code :

import requests
import json
url = "https://fanyi.baidu.com/basetrans"
query_str = input("请输入要翻译的中文:")
data = {
        "query":query_str,
        "from":"zh",
        "to":"en"}
headers = {
        "User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1",

        "Referer": "https://fanyi.baidu.com/?aldtype=16047&tpltype=sigma"
}
response = requests.post(url,data=data,headers=headers)
html_str = response.content.decode()#json字符串
#json数据交换格式,使用json之前需要导入
#把json字符串转化为Python类型
dict_ret = json.loads(html_str)
#print(dict_ret)
#print(type(dict_ret))
ret = dict_ret["trans"][0]["dst"]
print("翻译结果是:",ret)

러닝 효과

:

위 내용은 Python은 Baidu Translation을 크롤링합니다(json을 사용하여 데이터 추출).의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 cnblogs.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제