찾다

 >  Q&A  >  본문

网页爬虫 - Python:爬虫的中文编码问题?

爬取中文网页后正则匹配出中文,得打UTF-8的编码字符

将其输出为.csv文件

在.CSV中显示为乱码

用记事本打开.csv又可以正常显示为中文

有没有大神指点是怎么一回事?怎样才能在Excel里直接看到中文?

ringa_leeringa_lee2785일 전565

모든 응답(4)나는 대답할 것이다

  • PHP中文网

    PHP中文网2017-04-18 10:28:54

    간단한 방법은 pandasto_excel 메서드를 사용하여 .xlsx 파일로 변환하는 것입니다. .xlsx의 기본 인코딩은 기본적으로 Excel을 지원하기 때문입니다. 물론 차이점은 그럴 수 없다는 것입니다. 메모장으로 열었습니다.

    으아악

    여기에는 테스트할 창이 없습니다. gb2312 또는 gbk으로 인코딩을 작성해 보세요.

    테이블 파일 I/O의 경우 실제로 pandas가 더 편리합니다.

    회신하다
    0
  • 伊谢尔伦

    伊谢尔伦2017-04-18 10:28:54

    abs1=abs1.decode().encode('gbk')

    회신하다
    0
  • 高洛峰

    高洛峰2017-04-18 10:28:54

    Excel은 기본적으로 GBK 인코딩을 사용합니다.

    회신하다
    0
  • PHP中文网

    PHP中文网2017-04-18 10:28:54

    새 Excel 파일을 만든 다음 텍스트에서 데이터를 클릭하여 csv 파일을 가져옵니다

    회신하다
    0
  • 취소회신하다