搜尋
首頁Javajava教程哈希--常見的演算法介紹

哈希--常見的演算法介紹

Jun 29, 2017 am 11:29 AM
哈希

  哈希(Hash)又稱為散列,它是一個很常見的演算法。在JavaHashMap資料結構中主要就利用了雜湊。哈希演算法包括了哈希函數和哈希表兩部分。我們陣列的特性可以知道,可以透過下標快速(O(1))的定位元素,同理在雜湊表中我們可以透過鍵(雜湊值)快速的定位某個值,這個哈希值的計算就是透過哈希函數(hash(key) = address )計算出來的。透過雜湊值即能定位元素[address] = value,原理同數組類似。

最好的雜湊函數當然是每個key值都能計算出唯一的雜湊值,但往往可能存在不同的key值的雜湊值,這就造成了衝突,評判一個雜湊函數是否設計良好的兩個面向:

##  1.衝突少。

  2.計算快。

  下面給出幾種常用的雜湊函數,它們的背後都有一定的數學原理且經過大量實踐,其數學原理不在這裡探究。

BKDR雜湊函數(h = 31 * h + c

#  這個雜湊函數被應用在

Java的字串雜湊值計算。

 

//String#hashCodepublic int hashCode() {int h = hash;if (h == 0 && value.length > 0) {char val[] = value;for (int i = 0; i <div class="cnblogs_code"></div> <p></p><p><span style="font-size: 16px;">#DJB2 <strong>雜湊函數(<span style="font-family: SimSun;"></span>#h = h </strong></span>)<span style="font-family: SimSun;"></span></p>  ElasticSearch<p>就利用了<span style="font-family: SimSun;"></span>DJB2<span style="font-family: Calibri;"></span>雜湊函數對要索引文件的指定<span style="font-family: SimSun;"></span>key<span style="font-family: Calibri;"></span>#進行雜湊。 <span style="font-family: SimSun;"></span></p><p><span style="font-size: 16px;">SDBM<strong>雜湊函數(<span style="font-family: SimSun;"></span><span style="font-family: Calibri;"></span><span style="font-family: SimSun;">SDBM</span>雜湊函數(</strong></span>h = h </p><p>)<span style="font-family: Calibri;"></span><span style="font-family: SimSun;"></span></p>#  在<p>SDBM</p><p>(簡單的資料庫引擎)中被應用。 <strong><span style="font-size: 18px;"></span>  以上只是列舉了三種雜湊函數,我們做下試驗,看看它們的衝突情況是怎麼樣的。 </strong></p><div class="cnblogs_code">  </div>Java<p><span style="font-family: Calibri;"></span><span style="font-family: SimSun;"> ##100</span><span style="font-family: Calibri;">萬、</span><span style="font-family: SimSun;">200</span><span style="font-family: Calibri;">萬的衝突數情況:</span><span style="font-family: SimSun;"></span></p><p><span style="font-family: SimSun;"><img src="/static/imghwm/default1.png" data-src="https://img.php.cn/upload/article/000/000/001/6d0143f1fa951707d245c36e169c2fd5-0.png?x-oss-process=image/resize,p_40" class="lazy" alt=""></span></p><p><img src="/static/imghwm/default1.png" data-src="https://img.php.cn/upload/article/000/000/001/6d0143f1fa951707d245c36e169c2fd5-1.png?x-oss-process=image/resize,p_40" class="lazy" alt=""></p><p><img src="/static/imghwm/default1.png" data-src="https://img.php.cn/upload/article/000/000/001/6d0143f1fa951707d245c36e169c2fd5-2.png?x-oss-process=image/resize,p_40" class="lazy" alt=""></p><p></p><p><span   style="max-width:90%"><strong></strong><strong></strong></span></p><div class="cnblogs_code"></div>###############  反覆試驗實際上三種雜湊函數的衝突數差不多。 ######   ######Python######3############<pre class="brush:php;toolbar:false"> 1 package com.algorithm.hash; 2  3 import java.util.HashMap; 4 import java.util.UUID; 5  6 /** 7  * 三种哈希函数冲突数比较 8  * Created by yulinfeng on 6/27/17. 9  */10 public class HashFunc {11 12     public static void main(String[] args) {13         int length = 1000000;   //100万字符串14         //利用HashMap来计算冲突数,HashMap的键值不能重复所以length - map.size()即为冲突数15         HashMap<string> bkdrMap = new HashMap<string>();16         HashMap<string> djb2Map = new HashMap<string>();17         HashMap<string> sdbmMap = new HashMap<string>();18         getStr(length, bkdrMap, djb2Map, sdbmMap);19         System.out.println("BKDR哈希函数100万字符串的冲突数:" + (length - bkdrMap.size()));20         System.out.println("DJB2哈希函数100万字符串的冲突数:" + (length - djb2Map.size()));21         System.out.println("SDBM哈希函数100万字符串的冲突数:" + (length - sdbmMap.size()));22     }23 24     /**25      * 生成字符串,并计算冲突数26      * @param length27      * @param bkdrMap28      * @param djb2Map29      * @param sdbmMap30      */31     private static void getStr(int length, HashMap<string> bkdrMap, HashMap<string> djb2Map, HashMap<string> sdbmMap) {32         for (int i = 0; i ###<p>  雜湊表是一種資料結構,它需要配合雜湊函數使用,用於建立索引,以便快速查找<span style="font-family: Calibri;">——</span><span style="font-family: SimSun;">#《演算法筆記》。一般來講它就是一個定長的儲存空間,例如</span><span style="font-family: Calibri;">HashMap</span><span style="font-family: SimSun;">預設的雜湊表就是定長為</span><span style="font-family: Calibri;">16</span><span style="font-family: SimSun;">#的</span><span style="font-family: Calibri;">Entry</span><span style="font-family: SimSun;">陣列。有了定長的儲存空間過後,剩下的問題就是如何將值放入哪個位置,通常如果雜湊值是</span><span style="font-family: Calibri;">m</span><span style="font-family: SimSun;">,長度為</span><span style="font-family: Calibri;"> n</span><span style="font-family: SimSun;">,那麼這個值就放到</span><span style="font-family: Calibri;">m mod n</span><span style="font-family: SimSun;">位置。 </span></p>
<p> <img src="/static/imghwm/default1.png" data-src="https://img.php.cn/upload/article/000/000/001/6d0143f1fa951707d245c36e169c2fd5-3.png?x-oss-process=image/resize,p_40" class="lazy" alt=""></p>
<p>  上圖是雜湊和雜湊表,以及產生衝突的解決方法(拉鍊法)。產生衝突後的解決辦法有很多,有再哈希一次直到沒有衝突,也有向上圖一樣採用拉鍊法利用鍊錶將相同位置的元素串聯。 </p>
<p>  想像一下,上面的例子哈希表的長度為<span style="font-family: Calibri;">10</span><span style="font-family: SimSun;">,產生了</span>##1<span style="font-family: Calibri;"></span>次衝突,如果哈希表長度為<span style="font-family: SimSun;"></span>20<span style="font-family: Calibri;"></span>,那麼就不會產生衝突查找更快但會浪費更多空間,如果雜湊表長度為<span style="font-family: SimSun;"></span>2<span style="font-family: Calibri;"></span>,將會倒置<span style="font-family: SimSun;"></span>3<span style="font-family: Calibri;"></span>次衝突查找更慢但這樣又會節省不少空間。 <span style="font-family: SimSun;">所以哈希表的長度選擇至關重要,但同時也是一個重要的難題。 <strong></strong></span></p>
<p>補充:<em></em></p>
<p>  哈希在很多方面有應用,例如在不同的值有不同的雜湊值,但也可以將雜湊演算法設計精妙使得相似或相同的值有相似或相同的雜湊值。也就是說如果兩個物件完全不同,那麼它們的雜湊值也完全不同;如果兩個物件完全相同,那麼它們的雜湊值也完全相同;兩個物件越相似,那麼它們的雜湊值也就越相似。這其實就是相似性問題,也就是說這個想法可以被推廣應用在相似性的計算(例如Jaccard距離問題),最後應用到廣告精準投放、商品推薦等。 <em></em></p>
<p>  另外,一致性雜湊也可應用在負載平衡,如何保證每台伺服器能均勻的分攤負載壓力,一個好的雜湊演算法也可做到。 <em></em></p></string></string></string></string></string></string></string></string></string>

以上是哈希--常見的演算法介紹的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
如何將Maven或Gradle用於高級Java項目管理,構建自動化和依賴性解決方案?如何將Maven或Gradle用於高級Java項目管理,構建自動化和依賴性解決方案?Mar 17, 2025 pm 05:46 PM

本文討論了使用Maven和Gradle進行Java項目管理,構建自動化和依賴性解決方案,以比較其方法和優化策略。

如何使用適當的版本控制和依賴項管理創建和使用自定義Java庫(JAR文件)?如何使用適當的版本控制和依賴項管理創建和使用自定義Java庫(JAR文件)?Mar 17, 2025 pm 05:45 PM

本文使用Maven和Gradle之類的工具討論了具有適當的版本控制和依賴關係管理的自定義Java庫(JAR文件)的創建和使用。

如何使用咖啡因或Guava Cache等庫在Java應用程序中實現多層緩存?如何使用咖啡因或Guava Cache等庫在Java應用程序中實現多層緩存?Mar 17, 2025 pm 05:44 PM

本文討論了使用咖啡因和Guava緩存在Java中實施多層緩存以提高應用程序性能。它涵蓋設置,集成和績效優勢,以及配置和驅逐政策管理最佳PRA

如何將JPA(Java持久性API)用於具有高級功能(例如緩存和懶惰加載)的對象相關映射?如何將JPA(Java持久性API)用於具有高級功能(例如緩存和懶惰加載)的對象相關映射?Mar 17, 2025 pm 05:43 PM

本文討論了使用JPA進行對象相關映射,並具有高級功能,例如緩存和懶惰加載。它涵蓋了設置,實體映射和優化性能的最佳實踐,同時突出潛在的陷阱。[159個字符]

Java的類負載機制如何起作用,包括不同的類載荷及其委託模型?Java的類負載機制如何起作用,包括不同的類載荷及其委託模型?Mar 17, 2025 pm 05:35 PM

Java的類上載涉及使用帶有引導,擴展程序和應用程序類負載器的分層系統加載,鏈接和初始化類。父代授權模型確保首先加載核心類別,從而影響自定義類LOA

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。