Heim  >  Artikel  >  Backend-Entwicklung  >  Gibt es einen Grund, warum „strings.EqualFold“ nicht zuerst einen Längenvergleich durchführt?

Gibt es einen Grund, warum „strings.EqualFold“ nicht zuerst einen Längenvergleich durchführt?

王林
王林nach vorne
2024-02-13 21:03:08507Durchsuche

`strings.EqualFold` 不首先进行长度比较是否有原因?

PHP-Editor Apple, heute besprechen wir den Grund, warum die Funktion „strings.EqualFold“ beim Vergleich, ob Zeichenfolgen gleich sind, nicht zuerst einen Längenvergleich durchführt. Beim String-Vergleich verwenden wir häufig die Funktion „strings.EqualFold“, um die Groß-/Kleinschreibung für den Vergleich zu ignorieren. Einige fragen sich jedoch möglicherweise, warum diese Funktion nicht zuerst einen Längenvergleich durchführt. Im folgenden Artikel werden wir diese Frage beantworten und die Gründe für dieses Design diskutieren. Lass uns einen Blick darauf werfen!

Frageninhalt

Eine gängige Praxis zum Vergleichen von Zeichenfolgen ohne Berücksichtigung der Groß-/Kleinschreibung besteht darin, zunächst explizit die Länge zu überprüfen:

if len(a) == len(b) && strings.EqualFold(a, b) { ... }

Dies scheint ein Workaround zu sein, da die aktuelle Implementierung nur dann eine Längenprüfung durchführt, wenn einer der beiden Eingabestrings erschöpft ist.

Gibt es einen leistungsbezogenen oder sonstigen Grund, nicht zuerst eine Längenprüfung durchzuführen?

Problemumgehung

Die kurze Antwort lautet, dass in Go zwei Zeichenfolgen unterschiedliche Längen haben können, aber bei einfacher Unicode-Groß-/Kleinschreibung immer noch gleich sind (ein erster Längenvergleich bestimmt also nicht die Gleichheit der Groß-/Kleinschreibung).

Die längere Antwort lautet: Go speichert Zeichenfolgen im Speicher als UTF-8Byte, und die integrierte len()-Funktion meldet die UTF-8-codierte Anzahl von Bytes. UTF-8 ist eine Zeichenkodierung mit variabler Länge: Es kann eine andere Anzahl von Bytes für einen einzelnen Unicode-Codepunkt verwenden, sodass übereinstimmende Codepunkte mit Fallfaltung möglicherweise eine andere Anzahl von Bytes in UTF-8 verwenden.

Sehen Sie sich ein Beispiel an, um dies zu beweisen:

s1, s2 := "\u017F", "\u0073"
fmt.Println(s1, s2)

fmt.Println(len(s1), len(s2), strings.EqualFold(s1, s2))

Dies wird ausgegeben (versuchen Sie es auf Go Playground):

ſ s
2 1 true

Das obige ist der detaillierte Inhalt vonGibt es einen Grund, warum „strings.EqualFold“ nicht zuerst einen Längenvergleich durchführt?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:stackoverflow.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen