문자의 임의 문자열(대문자 또는 소문자)만 원합니다. ), Go에서는 숫자가 없습니다. 이를 수행하는 가장 빠르고 간단한 방법은 무엇입니까?
질문은 "가장 빠르고 간단한" 접근 방식을 추구합니다. Paul의 답변은 간단한 기술을 제공합니다. 그러나 "가장 빠른" 측면도 고려해 보겠습니다. 코드를 반복적으로 개선하여 최적화된 솔루션을 찾아보겠습니다.
1. 창세기(룬)
최적화할 초기 솔루션은 다음과 같습니다.
<code class="go">import ( "math/rand" "time" ) var letterRunes = []rune("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ") func RandStringRunes(n int) string { b := make([]rune, n) for i := range b { b[i] = letterRunes[rand.Intn(len(letterRunes))] } return string(b) }</code>
2. 바이트
임의의 문자열에 사용되는 문자가 영어 대문자와 소문자로 제한되는 경우 영어 알파벳 문자가 UTF-8 인코딩의 바이트에 1:1로 매핑되므로 바이트로 작업할 수 있습니다( Go가 문자열을 저장하는 데 사용하는 것).
따라서 다음을
<code class="go">var letters = []rune("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")</code>
다음으로 바꿀 수 있습니다:
<code class="go">var letters = []byte("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")</code>
또는 더 나은 방법:
<code class="go">const letters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"</code>
이제 const를 사용할 수 있기 때문에 이는 상당한 개선입니다(Go에서는 문자열 상수를 지원하지만 슬라이스 상수는 지원하지 않음). 추가적으로 len(문자)라는 표현도 상수입니다.
3. 나머지
이전 솔루션에서는 rand.Intn()(Rand.Intn() 및 추가로 Rand.Int31n()에 위임)을 호출하여 문자에 대한 임의의 숫자를 결정했습니다.
이것은 63개의 임의 비트로 난수를 생성하는 rand.Int63()을 사용하는 것보다 느립니다.
따라서 간단히 rand.Int63()을 호출하고 len(문자)로 나눈 후 나머지를 사용할 수 있습니다.
<code class="go">func RandStringBytesRmndr(n int) string { b := make([]byte, n) for i := range b { b[i] = letters[rand.Int63() % int64(len(letters))] } return string(b) }</code>
모든 문자의 균등한 확률 분포를 유지하면서 더 빠릅니다(왜곡은 무시할 수 있지만 52개의 문자 수는 1<<63 - 1보다 훨씬 작습니다).
4. 마스킹
문자 수를 나타낼 수 있을 만큼 난수의 가장 낮은 비트만 사용하면 문자의 균등한 분포를 유지할 수 있습니다. 52개의 문자에는 6비트가 필요합니다: 52 = 110100b. 따라서 rand.Int63()에서 반환된 숫자의 가장 낮은 6비트만 사용합니다.
또한 숫자가 0..len(letterBytes)-1 범위 내에 있는 경우에만 숫자를 "수락"합니다. . 가장 낮은 비트가 더 크면 폐기하고 새 번호를 요청합니다.
<code class="go">const ( letterIdxBits = 6 // 6 bits to represent a letter index letterIdxMask = 1<<letterIdxBits - 1 // All 1-bits, as many as letterIdxBits ) func RandStringBytesMask(n int) string { b := make([]byte, n) for i := 0; i < n; { if idx := int(rand.Int63() & letterIdxMask); idx < len(letterBytes) { b[i] = letterBytes[idx] i++ } } return string(b) }
5. 마스킹 개선
이전 솔루션은 rand.Int63()의 63개 임의 비트 중 가장 낮은 6비트만 사용했습니다. 무작위 비트를 얻는 것이 우리 알고리즘에서 가장 느린 부분이기 때문에 이는 비효율적입니다.
52개의 문자가 있으므로 6비트는 문자 인덱스를 코딩합니다. 63개의 무작위 비트는 63/6 = 10개의 다른 문자 인덱스를 지정할 수 있습니다. 10개를 모두 활용해보자:
const (
letterIdxBits = 6 // 6 bits to represent a letter index
letterIdxMask = 1<= 0; {
if remain == 0 {
cache, remain = rand.Int63(), letterIdxMax
}
if idx := int(cache & letterIdxMask); idx < len(letterBytes) {
b[i] = letterBytes[idx]
i--
}
cache >>= letterIdxBits
remain--
}
return string(b)
}
6. 소스
Masking Improved는 상당히 효율적입니다. 또 다른 측면, 즉 난수의 출처를 고려해 보겠습니다.
crypto/rand 패키지는 Read(b []byte) 기능을 제공합니다. 그러나 crypto/rand는 속도가 느린 암호학적으로 안전한 의사 난수 생성기를 구현하기 때문에 성능에 도움이 되지 않습니다.
그래서 우리는 math/rand 패키지를 계속 사용하겠습니다. rand.Rand는 rand.Source를 무작위 비트의 소스로 사용합니다. 따라서 rand.Source를 직접 사용할 수 있습니다:
<code class="go">import (
"math/rand"
"time"
)
var letterRunes = []rune("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")
func RandStringRunes(n int) string {
b := make([]rune, n)
for i := range b {
b[i] = letterRunes[rand.Intn(len(letterRunes))]
}
return string(b)
}</code>
7. strings.Builder
를 활용하면 이전 솔루션에서는 먼저 슬라이스(Genesis의 []rune 및 이후의 []byte)에서 구성된 문자열을 반환한 다음 문자열로 변환했습니다. 문자열 값은 변경할 수 없으므로 이 최종 변환에서는 슬라이스 내용을 복사해야 합니다.
Go 1.10에서는 strings.Builder가 도입되었습니다. 이 새로운 유형은 bytes.Buffer와 유사하게 문자열 내용을 작성하는 데 사용할 수 있습니다. 내부적으로 []바이트를 사용하며 문자열을 생성하기 위해 내용을 복사할 필요가 없습니다.
<code class="go">var letters = []rune("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")</code>
8. unsafe
strings.Builder 패키지를 사용하여 strings.Builder를 "모방"하는 것은 우리가 했던 것처럼 내부 []바이트에 문자열을 빌드합니다. 따라서 strings.Builder를 사용하면 약간의 오버헤드가 발생하므로 최종 복사를 피하기 위해 전환했습니다.
그러나 unsafe:
<code class="go">var letters = []byte("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")</code>
패키지를 사용하여 이 복사를 피할 수도 있습니다.위 내용은 Go에서 설정된 길이의 빠르고 무작위 문자열을 어떻게 생성합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!