집 >백엔드 개발 >C#.Net 튜토리얼 >잘못된 중국어 파일을 읽기 위한 C# 솔루션
FileStream aFile = new FileStream(SingleFile, FileMode.Open); StreamReader sr = new StreamReader(aFile, Encoding.GetEncoding("gb2312"), true); string FileContent = sr.ReadToEnd(); aFile.Close(); ProcessData Pd = new ProcessData(); Pd.ProceData(FileContent);
StreamReader는 3개의 매개변수를 사용합니다. 마지막 매개변수는 utf-8을 자동으로 감지합니다. 대부분의 중국어는 gb2312입니다. utf-8이 아닌 경우 gb2312를 사용하세요.
시스템에는 utf 감지 기능이 포함되어 있습니다. , 다음을 참조하세요
private void DetectEncoding() { if (this.byteLen >= 2) { this._detectEncoding = false; bool flag = false; if ((this.byteBuffer[0] == 0xfe) && (this.byteBuffer[1] == 0xff)) { this.encoding = new UnicodeEncoding(true, true); this.CompressBuffer(2); flag = true; } else if ((this.byteBuffer[0] == 0xff) && (this.byteBuffer[1] == 0xfe)) { if (((this.byteLen < 4) || (this.byteBuffer[2] != 0)) || (this.byteBuffer[3] != 0)) { this.encoding = new UnicodeEncoding(false, true); this.CompressBuffer(2); flag = true; } else { this.encoding = new UTF32Encoding(false, true); this.CompressBuffer(4); flag = true; } } else if (((this.byteLen >= 3) && (this.byteBuffer[0] == 0xef)) && ((this.byteBuffer[1] == 0xbb) && (this.byteBuffer[2] == 0xbf))) { this.encoding = Encoding.UTF8; this.CompressBuffer(3); flag = true; } else if ((((this.byteLen >= 4) && (this.byteBuffer[0] == 0)) && ((this.byteBuffer[1] == 0) && (this.byteBuffer[2] == 0xfe))) && (this.byteBuffer[3] == 0xff)) { this.encoding = new UTF32Encoding(true, true); this.CompressBuffer(4); flag = true; } else if (this.byteLen == 2) { this._detectEncoding = true; } if (flag) { this.decoder = this.encoding.GetDecoder(); this._maxCharsPerBuffer = this.encoding.GetMaxCharCount(this.byteBuffer.Length); this.charBuffer = new char[this._maxCharsPerBuffer]; } } }