>  기사  >  백엔드 개발  >  Go에서 문자열을 뒤집는 방법, 발음 구별 부호를 결합한 유니코드 처리?

Go에서 문자열을 뒤집는 방법, 발음 구별 부호를 결합한 유니코드 처리?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-10-27 15:57:01136검색

How to Reverse a String in Go, Handling Unicode Combining Diacritical Marks?

Go에서 문자열 조작: 문자 반전에 대한 자세한 가이드

Go에서 문자열은 문자 시퀀스가 ​​아닌 바이트 조각으로 처리됩니다. 이로 인해 문자열 반전과 같은 문자 수준 작업을 수행하는 것이 어려울 수 있습니다.

문제 이해:

다음 시나리오를 고려해 보겠습니다. 길이가 다양한 임의 문자로 구성된 여러 문자열(100, 200, 300, 400, 500). 우리는 각 문자열의 문자를 반전시키고 싶습니다.

과제:

문자를 문자열의 다른 인덱스에 직접 할당하려고 시도하면 오류가 발생합니다. Go에서는 직접적인 문자 수준을 허용하지 않기 때문입니다. 문자열에 할당합니다.

유니코드 고려 사항:

Andrew Sellers는 구별 부호(CDM)와 기타 복잡한 유니코드 문자를 결합한 유니코드를 처리하는 혁신적인 접근 방식을 제공합니다.

그는 문자열 내의 문자 결합에 영향을 미치는 복잡한 유니코드 블록의 일부인 CDM의 순서를 감지하고 보존하는 기술을 소개합니다.

해결책:

해결책에는 문자열을 반복하는 작업이 포함됩니다. 역순으로 배열하고 범위 테이블을 사용하여 CDM을 식별합니다. CDM은 저장된 다음 역방향 배열에 추가하기 전에 일반 문자와 결합됩니다.

복잡한 유니코드 문자 처리:

이모지 및 수식어와 같은 문자의 경우, CDM을 보존하기 위해 접근 방식에 특별한 주의가 필요합니다. 요소의 순서와 구성된 글리프의 올바른 표현.

Go에서 솔루션 구현:

다음은 Andrew Sellers의 접근 방식을 기반으로 한 코드 조각입니다.

<code class="go">package main

import (
    "fmt"
    "os"
    "runtime"
    "unicode"
)

func main() {
    var stringsToReverse = []string{"Hello, World", "??⃠?", "??‍?????‍⚖️", "aͤoͧiͤ  š́ž́ʟ́", "H̙̖ell͔o̙̟͚͎̗̹̬ ̯W̖͝ǫ̬̞̜rḷ̦̣̪d̰̲̗͈"}
    for _, s := range stringsToReverse {
        fmt.Printf("Reverse '%s' => '%s'\n", s, ReverseString(s))
    }

    fmt.Printf("Memory usage: %d bytes\n", runtime.MemStats.Alloc)
    os.Exit(0)
}

// ReverseString reverses the characters in a string, handling Unicode combining diacritical marks
func ReverseString(s string) string {
    sv := []rune(s)
    cv := make([]rune, 0)
    rv := make([]rune, 0)

    for ix := len(sv) - 1; ix >= 0; ix-- {
        r := sv[ix]
        if unicode.In(r, combining) {
            cv = append(cv, r)
            fmt.Printf("Detect combining diacritical mark ' %c'\n", r)
        } else {
            rrv := make([]rune, 0, len(cv)+1)
            rrv = append(rrv, r)
            rrv = append(rrv, cv...)
            fmt.Printf("regular mark '%c' (with '%d' combining diacritical marks '%s') => '%s'\n", r, len(cv), string(cv), string(rrv))
            rv = append(rv, rrv...)
            cv = make([]rune, 0)
        }
    }

    return string(rv)
}</code>

위 내용은 Go에서 문자열을 뒤집는 방법, 발음 구별 부호를 결합한 유니코드 처리?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.