>  Q&A  >  본문

网页爬虫 - 关于Python的编码与解码问题

在python2中用urllib模块去请求淘宝的IP地址查询接口,返回的是一段json字符串,如下所示:

import urllib


def get_data(ip):
    url = "http://ip.taobao.com/service/getIpInfo.php?ip=" + ip
    data = urllib.urlopen(url).read()

    return data


if __name__ == "__main__":
    result = get_data("59.151.5.5")
    print(result)

返回结果如下:

{"code":0,"data":{"country":"\u4e2d\u56fd","country_id":"CN","area":"\u534e\u5317","area_id":"100000","region":"\u5317\u4eac\u5e02","region_id":"110000","city":"\u5317\u4eac\u5e02","city_id":"110100","county":"","county_id":"-1","isp":"\u4e16\u7eaa\u4e92\u8054","isp_id":"100021","ip":"59.151.5.5"}}

在返回结果中,中文是以 unicode字符串表示,这样不方便阅读,我想让结果中中文部分直接用中文表示,就像下面这样:

"city":"北京","ISP":"中国电信"

如果是python3的话返回又是这样的:


    b'{"code":0,"data":{"country":"\\u4e2d\\u56fd","country_id":"CN","area":"\\u534e\\u5317","area_id":"100000","region":"\\u5317\\u4eac\\u5e02","region_id":"110000","city":"\\u5317\\u4eac\\u5e02","city_id":"110100","county":"","county_id":"-1","isp":"\\u4e16\\u7eaa\\u4e92\\u8054","isp_id":"100021","ip":"59.151.5.5"}}'

请问在 python2和python3中分别该如何转码呢?

高洛峰高洛峰2714일 전539

모든 응답(4)나는 대답할 것이다

  • 伊谢尔伦

    伊谢尔伦2017-04-18 10:33:42

    Python3에는 문제를 해결할 수 있는 두 가지 방법이 있습니다.

    • print() 함수

    Python3은 UTF-8로 인코딩을 시작하므로 직접 인쇄하세요.

    으아악
    • 유니코드 데이터베이스 사용

    내장 라이브러리가 있습니다unicodedata. 이 라이브러리에서는 다음과 같이 두 가지 메소드를 호출할 수 있습니다.

    으아악

    추가로 문자를 개별적으로 처리하는 경우 위의 방법을 사용할 수 있지만 방금 답변을 해보니 반환 값이 Python3에서 매우 간단하다는 것을 알았습니다. 다음과 같습니다:

    으아악

    테스트 후 반환 값은 다음과 같습니다.

    으아악

    입양을 희망합니다

    회신하다
    0
  • 天蓬老师

    天蓬老师2017-04-18 10:33:42

    Python 3에서는 decode 메서드를 사용하여 바이트를 str:

    으로 변환할 수 있습니다. 으아악

    회신하다
    0
  • PHPz

    PHPz2017-04-18 10:33:42

    좋네요===

    으아악

    회신하다
    0
  • 阿神

    阿神2017-04-18 10:33:42

    py3을 사용해주세요

    회신하다
    0
  • 취소회신하다