搜尋
首頁後端開發php教程PHP中的Hash算法_PHP教程

PHP中的Hash算法_PHP教程

Jul 13, 2016 pm 05:47 PM
hashphptable關聯物件屬性陣列核心演算法

Hash Table是PHP的核心,这话一点都不过分.
PHP的数组,关联数组,对象属性,函数表,符号表,等等都是用HashTable来做为容器的.
PHP的HashTable采用的拉链法来解决冲突, 这个自不用多说, 我今天主要关注的就是PHP的Hash算法, 和这个算法本身透露出来的一些思想.
PHP的Hash采用的是目前最为普遍的DJBX33A (Daniel J. Bernstein, Times 33 with Addition), 这个算法被广泛运用与多个软件项目,Apache, Perl和Berkeley DB等. 对于字符串而言这是目前所知道的最好的哈希算法,原因在于该算法的速度非常快,而且分类非常好(冲突小,分布均匀).
算法的核心思想就是:
1.         hash(i) = hash(i-1) * 33 + str[i]
在zend_hash.h中,我们可以找到在PHP中的这个算法:
1.    static inline ulong zend_inline_hash_func(char *arKey, uint nKeyLength)
2.    {
3.        register ulong hash = 5381;
4.   
5.        /* variant with the hash unrolled eight times */
6.        for (; nKeyLength >= 8; nKeyLength -=   {
7.            hash = ((hash 8.            hash = ((hash 9.            hash = ((hash 10.           hash = ((hash 11.           hash = ((hash 12.           hash = ((hash 13.           hash = ((hash 14.           hash = ((hash 15.       }
16.       switch (nKeyLength) {
17.           case 7: hash = ((hash 18.           case 6: hash = ((hash 19.           case 5: hash = ((hash 20.           case 4: hash = ((hash 21.           case 3: hash = ((hash 22.           case 2: hash = ((hash 23.           case 1: hash = ((hash 24.           case 0: break;
25.   EMPTY_SWITCH_DEFAULT_CASE()
26.       }
27.       return hash;
28.   }
相比在Apache和Perl中直接采用的经典Times 33算法:
1.    hashing function used in Perl 5.005:
2.      # Return the hashed value of a string: $hash = perlhash("key")
3.      # (Defined by the PERL_HASH macro in hv.h)
4.      sub perlhash
5.      {
6.          $hash = 0;
7.          foreach (split //, shift) {
8.              $hash = $hash*33 + ord($_);
9.          }
10.         return $hash;
11.     }
在PHP的hash算法中, 我们可以看出很处细致的不同.
首先, 最不一样的就是, PHP中并没有使用直接乘33, 而是采用了:
1.      hash 这样当然会比用乘快了.
然后, 特别要主意的就是使用的unrolled, 我前几天看过一片文章讲Discuz的缓存机制, 其中就有一条说是Discuz会根据帖子的热度不同采用不同的缓存策略, 根据用户习惯,而只缓存帖子的第一页(因为很少有人会翻帖子).
于此类似的思想, PHP鼓励8位一下的字符索引, 他以8为单位使用unrolled来提高效率, 这不得不说也是个很细节的,很细致的地方.
另外还有inline, register变量 … 可以看出PHP的开发者在hash的优化上也是煞费苦心
最后就是, hash的初始值设置成了5381, 相比在Apache中的times算法和Perl中的Hash算法(都采用初始hash为0), 为什么选5381呢? 具体的原因我也不知道, 但是我发现了5381的一些特性:
1.    Magic Constant 5381:
2.      1. odd number
3.      2. prime number
4.      3. deficient number
5.      4. 001/010/100/000/101
看了这些, 我有理由相信这个初始值的选定能提供更好的分类.
至于说, 为什么是Times 33而不是Times 其他数字, 在PHP Hash算法的注释中也有一些说明, 希望对有兴趣的同学有用:
1.      DJBX33A (Daniel J. Bernstein, Times 33 with Addition)
2.   
3.      This is Daniel J. Bernstein's popular `times 33' hash function as
4.      posted by him years ago on comp.lang.c. It basically uses a function
5.      like ``hash(i) = hash(i-1) * 33 + str[i]''. This is one of the best
6.      known hash functions for strings. Because it is both computed very
7.      fast and distributes very well.
8.   
9.      The magic of number 33, i.e. why it works better than many other
10.     constants, prime or not, has never been adequately explained by
11.     anyone. So I try an explanation: if one experimentally tests all
12.     multipliers between 1 and 256 (as RSE did now) one detects that even
13.     numbers are not useable at all. The remaining 128 odd numbers
14.     (except for the number 1) work more or less all equally well. They
15.     all distribute in an acceptable way and this way fill a hash table
16.     with an average percent of approx. 86%.
17.  
18.     If one compares the Chi^2 values of the variants, the number 33 not
19.     even has the best value. But the number 33 and a few other equally
20.     good numbers like 17, 31, 63, 127 and 129 have nevertheless a great
21.     advantage to the remaining numbers in the large set of possible
22.     multipliers: their multiply operation can be replaced by a faster
23.     operation based on just one shift plus either a single addition
24.     or subtraction operation. And because a hash function has to both
25.     distribute good _and_ has to be very fast to compute, those few
26.     numbers should be preferred and seems to be the reason why Daniel J.
27.     Bernstein also preferred it.
28.  
29.     www.2cto.com        -- Ralf S. Engelschall
 
•     作者: Laruence
•     本文地址: http://www.laruence.com/2009/07/23/994.html

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/478471.htmlTechArticleHash Table是PHP的核心,这话一点都不过分. PHP的数组,关联数组,对象属性,函数表,符号表,等等都是用HashTable来做为容器的. PHP的HashTable采用的拉链...
陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
解釋負載平衡如何影響會話管理以及如何解決。解釋負載平衡如何影響會話管理以及如何解決。Apr 29, 2025 am 12:42 AM

負載均衡會影響會話管理,但可以通過會話複製、會話粘性和集中式會話存儲解決。 1.會話複製在服務器間複製會話數據。 2.會話粘性將用戶請求定向到同一服務器。 3.集中式會話存儲使用獨立服務器如Redis存儲會話數據,確保數據共享。

說明會話鎖定的概念。說明會話鎖定的概念。Apr 29, 2025 am 12:39 AM

Sessionlockingisatechniqueusedtoensureauser'ssessionremainsexclusivetooneuseratatime.Itiscrucialforpreventingdatacorruptionandsecuritybreachesinmulti-userapplications.Sessionlockingisimplementedusingserver-sidelockingmechanisms,suchasReentrantLockinJ

有其他PHP會議的選擇嗎?有其他PHP會議的選擇嗎?Apr 29, 2025 am 12:36 AM

PHP會話的替代方案包括Cookies、Token-basedAuthentication、Database-basedSessions和Redis/Memcached。 1.Cookies通過在客戶端存儲數據來管理會話,簡單但安全性低。 2.Token-basedAuthentication使用令牌驗證用戶,安全性高但需額外邏輯。 3.Database-basedSessions將數據存儲在數據庫中,擴展性好但可能影響性能。 4.Redis/Memcached使用分佈式緩存提高性能和擴展性,但需額外配

在PHP的上下文中定義'會話劫持”一詞。在PHP的上下文中定義'會話劫持”一詞。Apr 29, 2025 am 12:33 AM

Sessionhijacking是指攻擊者通過獲取用戶的sessionID來冒充用戶。防範方法包括:1)使用HTTPS加密通信;2)驗證sessionID的來源;3)使用安全的sessionID生成算法;4)定期更新sessionID。

PHP的完整形式是什麼?PHP的完整形式是什麼?Apr 28, 2025 pm 04:58 PM

文章討論了PHP,詳細介紹了其完整形式,在We​​b開發中的主要用途,與Python和Java的比較以及對初學者的學習便利性。

PHP如何處理形式數據?PHP如何處理形式數據?Apr 28, 2025 pm 04:57 PM

PHP使用$ \ _ post和$ \ _獲取超級全局的php處理數據,並通過驗證,消毒和安全數據庫交互確保安全性。

PHP和ASP.NET有什麼區別?PHP和ASP.NET有什麼區別?Apr 28, 2025 pm 04:56 PM

本文比較了PHP和ASP.NET,重點是它們對大規模Web應用程序,性能差異和安全功能的適用性。兩者對於大型項目都是可行的,但是PHP是開源和無關的,而ASP.NET,

PHP是對病例敏感的語言嗎?PHP是對病例敏感的語言嗎?Apr 28, 2025 pm 04:55 PM

PHP的情況敏感性各不相同:功能不敏感,而變量和類是敏感的。最佳實踐包括一致的命名和使用對案例不敏感的功能進行比較。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具