検索

ホームページ  >  に質問  >  本文

字符编码 - java读取文件的编码问题:有无BOM的UTF-8和GBK

java在读取文件的时候怎么去判断文件的编码:
有三种编码方式:有BOM的UTF-8、无BOM的UTF-8、GBK
在网上找了很多,都不是很准确的判断
特别是对无BOM的UTF-8和GBK的判断,有些例子要把文件读几遍,这样效率太低,不实用,有没有什么好的解决方法,请指教

迷茫迷茫2804日前855

全員に返信(3)返信します

  • PHP中文网

    PHP中文网2017-04-17 15:04:29

    ユーザーがアップロードしたファイルはさまざまな方法でエンコードされている可能性があるのは事実ですが、完璧な解決策が保証されるわけではありませんが、統計原則に基づいて最大限のファイル エンコード検出を提供できます。

    私は基本的に私のニーズを解決するこの cpdetector を使用しました。

    コード例を添付します:

    リーリー

    ファイルを書き込む方法は教えません。ファイルには URL を取得する方法があります。

    これらの jar を使用するときにインポートしました。

    リーリー

    見つからない場合は、メールを残していただければお送りします。

    返事
    0
  • PHP中文网

    PHP中文网2017-04-17 15:04:29

    InputStreamReaderを使用するとエンコーディングを指定できます。

    返事
    0
  • PHP中文网

    PHP中文网2017-04-17 15:04:29

    まだ完璧な解決策は見つかりません

    返事
    0
  • キャンセル返事