Rumah >pembangunan bahagian belakang >Golang >Keserasian cincang Murmur3 antara Go dan Python
editor php Zimo memperkenalkan anda kepada keserasian cincang Murmur3 antara Go dan Python. Murmur3 ialah algoritma cincang cekap yang biasa digunakan untuk operasi cincang dalam struktur data dan algoritma. Algoritma pencincangan Murmur3 dilaksanakan secara berbeza dalam dua bahasa pengaturcaraan Go dan Python, jadi isu keserasian mungkin timbul apabila menggunakannya. Artikel ini akan memperincikan perbezaan dalam algoritma pencincangan Murmur3 dalam Go dan Python serta menyediakan penyelesaian untuk memastikan keserasian cincang yang betul apabila menghantar data antara bahasa yang berbeza.
Kami mempunyai dua perpustakaan berbeza, satu dalam ular sawa dan satu lagi, yang perlu mengira cincang murmur3 dengan cara yang sama. Malangnya, tidak kira betapa sukarnya kami mencuba, kami tidak dapat memastikan perpustakaan menghasilkan hasil yang sama. Berdasarkan soalan ini tentang java dan python, keserasian tidak semestinya mudah.
Kini kami menggunakan python mmh3 dan pergi ke perpustakaan github.com/spaolacci/murmur3.
dalam perjalanan:
hash := murmur3.new128() hash.write([]byte("chocolate-covered-espresso-beans")) fmt.println(base64.rawurlencoding.encodetostring(hash.sum(nil))) // output: clhso2ncbxyoezvilm5gwg
Dalam ular sawa:
name = "chocolate-covered-espresso-beans" hash = mmh3.hash128(name.encode('utf-8'), signed=False).to_bytes(16, byteorder='big', signed=False) print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("=")) # Output: jns74izOYMJwsdKjacIHHA (big byteorder) hash = mmh3.hash128(name.encode('utf-8'), signed=False).to_bytes(16, byteorder='little', signed=False) print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("=")) # Output: HAfCaaPSsXDCYM4s4jt7jg (little byteorder) hash = mmh3.hash_bytes(name.encode('utf-8')) print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("=")) # Output: HAfCaaPSsXDCYM4s4jt7jg
In go, murmur3
返回一个uint64
,所以我们假设python中的signed=false
;但是我们也尝试了 signed=true
tidak mendapat nilai cincang yang sepadan.
Kami terbuka kepada perpustakaan yang berbeza, tetapi ingin mengetahui sama ada terdapat masalah dengan pendekatan go atau python kami untuk mengira cincangan yang dikodkan base64 daripada rentetan. Sebarang bantuan amat dihargai.
Hasil python pertama hampir betul.
>>> binascii.hexlify(base64.b64decode('jns74izoymjwsdkjacihha==')) b'8e7b3be22cce60c270b1d2a369c2071c'
dalam perjalanan:
x, y := murmur3.sum128([]byte("chocolate-covered-espresso-beans")) fmt.printf("%x %x\n", x, y)
Hasil:
70b1d2a369c2071c 8e7b3be22cce60c2
Jadi susunan kedua-dua perkataan ini terbalik. Untuk mendapatkan hasil yang sama dalam python anda boleh mencuba ini:
name = "chocolate-covered-espresso-beans" hash = mmh3.hash128(name.encode('utf-8'), signed=False).to_bytes(16, byteorder='big', signed=False) hash = hash[8:] + hash[:8] print(base64.urlsafe_b64encode(hash).decode('utf-8').strip("=")) # cLHSo2nCBxyOezviLM5gwg
Atas ialah kandungan terperinci Keserasian cincang Murmur3 antara Go dan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!