찾다
백엔드 개발C++C#에서 문자열의 인코딩을 안정적으로 결정하려면 어떻게 해야 합니까?

How Can I Reliably Determine the Encoding of a String in C#?

C#에서 문자열 인코딩을 결정하는 안정적인 방법

파일이나 파일 이름과 같은 소스의 문자열을 처리할 때 인코딩을 알 수 없는 상황에 자주 직면하게 됩니다. 이 경우 데이터를 올바르게 표시하고 해석하려면 코딩을 올바르게 결정하는 것이 중요합니다. C#에서는 이 문제를 해결하는 여러 가지 방법을 제공합니다.

Encoding.DetectEncoding 사용

Encoding.DetectEncoding 메서드는 기본적인 인코딩 감지 기능을 제공합니다. 바이트 패턴의 통계적 분석을 기반으로 인코딩을 식별하려고 시도합니다. 그러나 이 방법은 완전히 신뢰할 수 없으며 경우에 따라 실패할 수도 있습니다.

Encoding encoding = Encoding.DetectEncoding(bytes);

사용자 정의 인코딩 감지

보다 정확한 인코딩 감지를 위해 맞춤 구현을 생성할 수 있습니다. 이러한 방법에는 일반적으로 바이트 패턴, BOM(Byte Order Mark) 및 기타 경험적 방법을 확인하여 인코딩을 결정하는 작업이 포함됩니다. 다음은 맞춤 감지 방법의 예입니다.

public static Encoding DetectEncoding(byte[] bytes)
{
    // 检查 UTF-8 BOM
    if (bytes.Length >= 3 && bytes[0] == 0xEF && bytes[1] == 0xBB && bytes[2] == 0xBF)
    {
        return Encoding.UTF8;
    }
    // 检查 UTF-16 BOM
    else if (bytes.Length >= 2 && bytes[0] == 0xFF && bytes[1] == 0xFE)
    {
        return Encoding.Unicode;
    }
    else if (bytes.Length >= 2 && bytes[0] == 0xFE && bytes[1] == 0xFF)
    {
        return Encoding.BigEndianUnicode;
    }
    // 检查 UTF-32 BOM
    else if (bytes.Length >= 4 && bytes[0] == 0x00 && bytes[1] == 0x00 && bytes[2] == 0xFE && bytes[3] == 0xFF)
    {
        return Encoding.UTF32;
    }
    else if (bytes.Length >= 4 && bytes[0] == 0xFF && bytes[1] == 0xFE && bytes[2] == 0x00 && bytes[3] == 0x00)
    {
        return Encoding.UTF32;
    }
    // 检查 UTF-7 BOM
    else if (bytes.Length >= 3 && bytes[0] == 0x2B && bytes[1] == 0x2F && bytes[2] == 0x76)
    {
        return Encoding.UTF7;
    }
    // 使用默认编码
    else
    {
        return Encoding.Default;
    }
}

요약

C#에서 문자열 인코딩을 결정하려면 기본 제공 방법의 한계와 사용자 지정 검색 방법의 잠재적 이점을 신중하게 고려해야 합니다. 위의 기술을 사용하여 개발자는 문자열 인코딩 감지 코드의 정확성과 신뢰성을 향상시킬 수 있습니다.

위 내용은 C#에서 문자열의 인코딩을 안정적으로 결정하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
C 언어 함수에 의해 반환 된 값 유형은 무엇입니까? 반환 값을 결정하는 것은 무엇입니까?C 언어 함수에 의해 반환 된 값 유형은 무엇입니까? 반환 값을 결정하는 것은 무엇입니까?Mar 03, 2025 pm 05:52 PM

이 기사는 기본 (int, float, char 등), 파생 (배열, 포인터, 스트러크) 및 공극 유형을 포함하는 C 함수 리턴 유형에 대해 자세히 설명합니다. 컴파일러는 함수 선언과 반환 명령문을 통해 반환 유형을 결정합니다.

Gulc : C 도서관은 처음부터 구축되었습니다Gulc : C 도서관은 처음부터 구축되었습니다Mar 03, 2025 pm 05:46 PM

GULC는 최소 오버 헤드, 공격적인 인라인 및 컴파일러 최적화 우선 순위를 정하는 고성능 C 라이브러리입니다. 고주파 거래 및 임베디드 시스템과 같은 성능 크리티컬 애플리케이션에 이상적 인 디자인은 단순성, 모듈을 강조합니다.

C 언어 기능의 정의 및 호출 규칙은 무엇이며C 언어 기능의 정의 및 호출 규칙은 무엇이며Mar 03, 2025 pm 05:53 PM

이 기사는 C 함수 선언 대 정의, 인수 통과 (값 및 포인터 별), 리턴 값 및 메모리 누출 및 유형 불일치와 같은 일반적인 함정을 설명합니다. 모듈성 및 Provi에 대한 선언의 중요성을 강조합니다.

C 언어 함수 형식 문자 케이스 변환 단계C 언어 함수 형식 문자 케이스 변환 단계Mar 03, 2025 pm 05:53 PM

이 기사는 문자열 케이스 변환에 대한 C 기능을 자세히 설명합니다. ctype.h의 toupper () 및 tolower ()를 사용하고 문자열을 통한 반복 및 널 터미네이터를 처리합니다. ctype.h를 잊어 버리고 문자 그럴을 수정하는 것과 같은 일반적인 함정은 다음과 같습니다.

메모리에 저장된 C 언어 함수의 반환 값은 어디에 있습니까?메모리에 저장된 C 언어 함수의 반환 값은 어디에 있습니까?Mar 03, 2025 pm 05:51 PM

이 기사에서는 C 기능 반환 값 저장을 검사합니다. 작은 반환 값은 일반적으로 속도 레지스터에 저장됩니다. 더 큰 값은 포인터에 메모리 (스택 또는 힙)를 사용하여 수명에 영향을 미치고 수동 메모리 관리가 필요할 수 있습니다. 직접 ACC

뚜렷한 사용 및 문구 공유뚜렷한 사용 및 문구 공유Mar 03, 2025 pm 05:51 PM

이 기사는 형용사 "별개", 문법 기능, 공통 문구 (예 : "구별", "뚜렷하게 다른") 및 공식 대 비공식의 미묘한 응용 프로그램의 다각적 인 사용을 분석합니다.

STL (정렬, 찾기, 변환 등)의 알고리즘을 효율적으로 사용하려면 어떻게합니까?STL (정렬, 찾기, 변환 등)의 알고리즘을 효율적으로 사용하려면 어떻게합니까?Mar 12, 2025 pm 04:52 PM

이 기사는 효율적인 STL 알고리즘 사용을 자세히 설명합니다. 데이터 구조 선택 (벡터 대 목록), 알고리즘 복잡성 분석 (예 : std :: sort vs. std :: partial_sort), 반복자 사용 및 병렬 실행을 강조합니다. 일반적인 함정과 같은

C 표준 템플릿 라이브러리 (STL)는 어떻게 작동합니까?C 표준 템플릿 라이브러리 (STL)는 어떻게 작동합니까?Mar 12, 2025 pm 04:50 PM

이 기사에서는 컨테이너, 반복자, 알고리즘 및 함수 인 핵심 구성 요소에 중점을 둔 C 표준 템플릿 라이브러리 (STL)에 대해 설명합니다. 일반적인 프로그래밍을 가능하게하기 위해 이러한 상호 작용, 코드 효율성 및 가독성 개선 방법에 대해 자세히 설명합니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

맨티스BT

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

PhpStorm 맥 버전

PhpStorm 맥 버전

최신(2018.2.1) 전문 PHP 통합 개발 도구

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

Atom Editor Mac 버전 다운로드

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기