찾다

 >  Q&A  >  본문

字符编码 - java读取文件的编码问题:有无BOM的UTF-8和GBK

java在读取文件的时候怎么去判断文件的编码:
有三种编码方式:有BOM的UTF-8、无BOM的UTF-8、GBK
在网上找了很多,都不是很准确的判断
特别是对无BOM的UTF-8和GBK的判断,有些例子要把文件读几遍,这样效率太低,不实用,有没有什么好的解决方法,请指教

迷茫迷茫2804일 전848

모든 응답(3)나는 대답할 것이다

  • PHP中文网

    PHP中文网2017-04-17 15:04:29

    사용자가 업로드한 파일이 다양한 방식으로 인코딩될 수 있는 것은 사실입니다. 완벽한 해결을 보장할 수는 없지만 통계적 원리에 따라 최대한 파일 인코딩 감지 기능을 제공할 수 있습니다.

    나는 기본적으로 내 요구 사항을 해결하는 이 cpDetector를 사용했습니다.

    첨부된 코드 예시는 다음과 같습니다.

    으아악

    파일을 작성하는 방법은 제공하지 않습니다. 파일에는 URL을 가져오는 방법이 있습니다.

    이 항아리는 사용할 때 수입해서 사용했어요.

    으아악

    찾지 못하실 경우 이메일을 남겨주시면 보내드리겠습니다.

    회신하다
    0
  • PHP中文网

    PHP中文网2017-04-17 15:04:29

    InputStreamReader를 사용하면 인코딩을 지정할 수 있습니다.

    회신하다
    0
  • PHP中文网

    PHP中文网2017-04-17 15:04:29

    아직 완벽한 솔루션을 찾을 수 없습니다

    회신하다
    0
  • 취소회신하다