Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Keserasian cincang Murmur3 antara Go dan Python

Keserasian cincang Murmur3 antara Go dan Python

王林
王林ke hadapan
2024-02-09 13:10:191160semak imbas

Go 和 Python 之间的 Murmur3 哈希兼容性

editor php Zimo memperkenalkan anda kepada keserasian cincang Murmur3 antara Go dan Python. Murmur3 ialah algoritma cincang cekap yang biasa digunakan untuk operasi cincang dalam struktur data dan algoritma. Algoritma pencincangan Murmur3 dilaksanakan secara berbeza dalam dua bahasa pengaturcaraan Go dan Python, jadi isu keserasian mungkin timbul apabila menggunakannya. Artikel ini akan memperincikan perbezaan dalam algoritma pencincangan Murmur3 dalam Go dan Python serta menyediakan penyelesaian untuk memastikan keserasian cincang yang betul apabila menghantar data antara bahasa yang berbeza.

Kandungan soalan

Kami mempunyai dua perpustakaan berbeza, satu dalam ular sawa dan satu lagi, yang perlu mengira cincang murmur3 dengan cara yang sama. Malangnya, tidak kira betapa sukarnya kami mencuba, kami tidak dapat memastikan perpustakaan menghasilkan hasil yang sama. Berdasarkan soalan ini tentang java dan python, keserasian tidak semestinya mudah.

Kini kami menggunakan python mmh3 dan pergi ke perpustakaan github.com/spaolacci/murmur3.

dalam perjalanan:

hash := murmur3.new128()
hash.write([]byte("chocolate-covered-espresso-beans"))
fmt.println(base64.rawurlencoding.encodetostring(hash.sum(nil)))
// output: clhso2ncbxyoezvilm5gwg

Dalam ular sawa:

name = "chocolate-covered-espresso-beans"
hash = mmh3.hash128(name.encode('utf-8'), signed=False).to_bytes(16, byteorder='big', signed=False)
print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("="))
# Output: jns74izOYMJwsdKjacIHHA (big byteorder)

hash = mmh3.hash128(name.encode('utf-8'), signed=False).to_bytes(16, byteorder='little', signed=False)
print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("="))
# Output: HAfCaaPSsXDCYM4s4jt7jg (little byteorder)

hash = mmh3.hash_bytes(name.encode('utf-8'))
print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("="))
# Output: HAfCaaPSsXDCYM4s4jt7jg

In go, murmur3返回一个uint64,所以我们假设python中的signed=false;但是我们也尝试了 signed=true tidak mendapat nilai cincang yang sepadan.

Kami terbuka kepada perpustakaan yang berbeza, tetapi ingin mengetahui sama ada terdapat masalah dengan pendekatan go atau python kami untuk mengira cincangan yang dikodkan base64 daripada rentetan. Sebarang bantuan amat dihargai.

Penyelesaian

Hasil python pertama hampir betul.

>>> binascii.hexlify(base64.b64decode('jns74izoymjwsdkjacihha=='))
b'8e7b3be22cce60c270b1d2a369c2071c'

dalam perjalanan:

    x, y := murmur3.sum128([]byte("chocolate-covered-espresso-beans"))
    fmt.printf("%x %x\n", x, y)

Hasil:

70b1d2a369c2071c 8e7b3be22cce60c2

Jadi susunan kedua-dua perkataan ini terbalik. Untuk mendapatkan hasil yang sama dalam python anda boleh mencuba ini:

name = "chocolate-covered-espresso-beans"
hash = mmh3.hash128(name.encode('utf-8'), signed=False).to_bytes(16, byteorder='big', signed=False)
hash = hash[8:] + hash[:8]
print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("="))
# cLHSo2nCBxyOezviLM5gwg

Atas ialah kandungan terperinci Keserasian cincang Murmur3 antara Go dan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:stackoverflow.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam