>백엔드 개발 >Golang >Go에서 향상된 유니코드 처리를 사용하여 텍스트 입력을 ASCII로 정규화하는 방법은 무엇입니까?

Go에서 향상된 유니코드 처리를 사용하여 텍스트 입력을 ASCII로 정규화하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2024-10-24 07:28:291058검색

How to Normalize Text Input to ASCII Using Enhanced Unicode Handling in Go?

향상된 유니코드 처리를 사용하여 텍스트 입력을 ASCII로 정규화

ASCII가 아닌 문자를 해당 ASCII 문자로 변환하는 것은 많은 프로그래밍 상황에서 일반적인 요구 사항입니다. . 사용자 입력 작업 시 둥근 따옴표와 같은 특수 문자를 일관된 방식으로 처리해야 합니다.

룬 매핑을 위해 Strings.Map 활용

Go 표준 라이브러리 문자열의 룬(유니코드 코드 포인트)을 새 문자열로 효율적으로 변환하기 위한 strings.Map 함수를 제공합니다. 이 함수를 사용하면 문자 대체를 세부적으로 제어할 수 있습니다.

제공된 예에서 다음 코드는 strings.Map 함수를 사용하여 둥근 따옴표를 곧은 따옴표로 변환합니다.

<code class="go">data := "Hello “Frank” or ‹François› as you like to be ‘called’"
cleanedData := strings.Map(normalize, data)</code>

정규화 함수는 다음과 같습니다. 사전 정의된 유니코드 문자 범위를 기반으로 문자 대체를 처리하는 클로저:

<code class="go">func normalize(in rune) rune {
    switch in {
    case '“', '‹', '”', '›':
        return '"'
    case '‘', '’':
        return '\''
    }
    return in
}</code>

출력:

Original: Hello “Frank” or ‹François› as you like to be ‘called’
Cleaned: Hello "Frank" or "François" as you like to be 'called'

strings.Map을 활용하여 텍스트를 정규화할 수 있습니다. 문자열 대체에 의존하지 않고 동등한 ASCII로 입력합니다. 이는 다양한 프로그래밍 시나리오에서 비ASCII 문자를 처리하기 위한 다양하고 효율적인 접근 방식을 제공합니다.

위 내용은 Go에서 향상된 유니코드 처리를 사용하여 텍스트 입력을 ASCII로 정규화하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.