Python 3.3 中的哈希函数:为什么会话之间返回不同的结果
在 Python 3.3 中,内部 hash() 函数的行为异常,在不同会话中为同一字符串返回不同的哈希值。这种现象源于 Python 使用随机哈希种子作为安全措施。
随机哈希种子用于防止攻击者利用可预测的密钥来导致 tar-pitting 攻击。通过向哈希添加随机偏移量,攻击者无法预测哪些键会发生冲突。
要控制哈希函数的行为,可以设置 PYTHONHASHSEED 环境变量。可以指定固定的正种子来阻止随机性,而将其设置为 0 会完全禁用种子偏移。
在 Python 3.3 之前,随机哈希种子被禁用;但是,它默认启用。此更改不仅影响集合,还影响 Python 3.5 及更早版本中的字典。
此外,object.__hash__() 有一个特殊的行为:
需要注意的是,哈希值会影响字典和集合等映射的迭代顺序。但是,Python 不保证这种顺序,并且在不同的构建和版本之间可能会有所不同。
为了一致的哈希,请考虑使用 hashlib 模块,它提供加密哈希函数。此外,pybloom 利用这种方法来提高稳定性。
虽然随机哈希种子偏移量使攻击者难以确定偏移量,但它也阻止了偏移量本身的存储。然而,这确保了攻击者无法使用定时攻击来确定种子。
以上是为什么 Python 3.3 的哈希值在会话之间不同?的详细内容。更多信息请关注PHP中文网其他相关文章!