ホームページ >バックエンド開発 >PHPチュートリアル >同步 - PHP 实现多台服务器共用SESSION方案?
题目:
<code>如何实现多台服务器共用SESSION?</code>
回答:
<code>方案将SESSION保存到数据库,不同主机可以去读SESSION数据库来判断是否登录在线</code>
反问:
<code>如果并发访问很大的情况下,如何保证SESSION正常读取?</code>
这是一个面试题,回答了使用数据库来保存SESSION的时候,面试官不满意,我自己的思路是将这个题目思考为多个分站如何公用SESSION,比如顶级域和多子域。所以为了同步方便,想到的是数据库存放,但是如何处理并发量很高的情况?(弃用DB存放SESSION换其他方案?)
题目:
<code>如何实现多台服务器共用SESSION?</code>
回答:
<code>方案将SESSION保存到数据库,不同主机可以去读SESSION数据库来判断是否登录在线</code>
反问:
<code>如果并发访问很大的情况下,如何保证SESSION正常读取?</code>
这是一个面试题,回答了使用数据库来保存SESSION的时候,面试官不满意,我自己的思路是将这个题目思考为多个分站如何公用SESSION,比如顶级域和多子域。所以为了同步方便,想到的是数据库存放,但是如何处理并发量很高的情况?(弃用DB存放SESSION换其他方案?)
你说存 MySQL,然后面试官问并发很大怎么办,其实说明他不推荐存 MySQL。这种情况你得回答:存 Redis 或者 Memcached。
如果我是面试官,我会再问,用户量很大,单台 Redis 根本就放不下怎么办?这里也表明,把所有的 Session 全量存放单台机器上是不可行的。有2种方式:方法一,服务器端不保存 Session 了,将用户的 Session(注意:不仅是 SessionID) 存在用户本地(用 Cookie 或者 LocalData),但是明显有几个严重的问题:安全性、http传输的数据量、本地存储的上限等。还有,这就不是 Session 了,完全就是 Cookie 的方案。
方法二,那就是服务器端分布式存储了(Redis 集群、 Memcached 集群),既然是分布式,那么就必须保证用户每次请求都得到达指定的服务器,因为他的 Session 在那台指定分片上,标记的方式可以是在存在用户的 Cookie 里面,用户请求时,服务器根据 Cookie 里面的内容将请求 Route 到指定的分片上。
如果你这样回答了,我再问,如果某个分片挂了怎么办,那这所有用户的 Session 就丢了。这是就高可用了,对每个分片建多个复制集(从节点),主分片挂了,从节点就继续提供访问。
恩,分布式基本都是这个理。
用MySQL存储用户会话信息
基于数据库实现会话:
登录用户:
online1(sessid,session,time,version); $_COOKIE['myid']内容为:用户ID(作为sessid)+密码哈希(验证身份)
普通访客:
online2(sessid,session,time,version); $_COOKIE['myid']内容为:用户ID(为0)+会话ID(sessid)
sessid是用户ID,访客则为普通访客则为online_id()生成的ID.
session存储用户会话,内容是会话数组serialize序列化后的串.
time是记录的更新时间.
version是版本号,用于实现CAS(Check And Set)乐观锁,保证session字段数据的一致性.
访客唯一ID生成函数:
<code>function online_id(){ $time = !empty($_SERVER['REQUEST_TIME_FLOAT']) ? $_SERVER['REQUEST_TIME_FLOAT'] : mt_rand(); $addr = !empty($_SERVER['REMOTE_ADDR']) ? $_SERVER['REMOTE_ADDR'] : mt_rand(); $port = !empty($_SERVER['REMOTE_PORT']) ? $_SERVER['REMOTE_PORT'] : mt_rand(); $ua = !empty($_SERVER['HTTP_USER_AGENT']) ? $_SERVER['HTTP_USER_AGENT'] : mt_rand(); return md5(uniqid(mt_rand(), true).$time.$addr.$port.$ua.mt_rand()); }</code>
表结构:
<code>CREATE TABLE `online1` ( `sessid` int(10) unsigned NOT NULL DEFAULT '0', `session` varchar(20000) NOT NULL DEFAULT '', `time` int(10) unsigned NOT NULL DEFAULT '0', `version` int(10) unsigned NOT NULL DEFAULT '0', PRIMARY KEY (`sessid`), KEY (`time`), KEY (`version`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_general_ci; CREATE TABLE `online2` ( `sessid` char(32) NOT NULL DEFAULT '', `session` varchar(20000) NOT NULL DEFAULT '', `time` int(10) unsigned NOT NULL DEFAULT '0', `version` int(10) unsigned NOT NULL DEFAULT '0', PRIMARY KEY (`sessid`), KEY (`time`), KEY (`version`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_general_ci;</code>
读写函数:
<code>function cn_session_get($sessid) { CRUD($_COOKIE['myid'],online1,online2) + return unserialize($session); } function cn_session_set($sessid,$session) { serialize($session) + CURD_CAS_UPDATE }</code>
函数调用:
<code>$session = cn_session_get($sessid); print_r($session['cart']); $session['cart'] = array(); cn_session_set($sessid,$session); 或者 register_shutdown_function(cn_session_set,$sessid,$session);</code>
cnsessionset()时用版本号version进行冲突检测,保证session字段数据的一致性:
<code>cn_session_get: SELECT * FROM online WHERE sessid=1; cn_session_set: UPDATE online SET session=$session,version=last_version+1 WHERE id=1 AND version=last_version;</code>
如果没有更新记录,则返回AJAX操作失败的提示.
对比:PHP内置的会话机制使用的是排它锁(悲观锁).
sessionstart()开启的是一个对sessID会话文件的写保护锁,
其他页面操作同一个sessID会话文件的sessionstart()将会被阻塞,
直到请求完成或者用sessionwriteclose()显式关闭.
这样的SESSION锁机制就避免了下面的情况:
A页面和B页面读取了相同的一份会话信息.
A页面修改并写入了会话变量a.
B页面随后也修改并写入了会话变量b.
这时B页面会覆盖了之前A页面写入的会话变量a.
注意:这种并发一般很少发生,所以基于数据库实现的会话机制使用乐观锁,也是合理的,并不会频繁遇到操作失败的情况.
会话应用场景:记录登录后的用户信息,购物车(读取/添加/删除),观看记录,验证码,csrf_token.
把购物车数据存以序列化或JSON串形式存到数据库字段中,也就丧失了SQL查询功能.
如果是以数据库记录的形式来存储购物车,则方便进行SQL查询分析.
既然,已经放弃使用SQL,自然可以上NoSQL,比如Memcached/Redis,设计类似于上述MySQL的方案.
@eechen 给出的是单节点或者同一主域名下的多节点之间使用自定义存储session的步骤,其实php本身就有使用外置存储保存的功能,可以看这一篇教程:http://www.sitepoint.com/saving-php-sessions-in-redis/ 。由于对于所有web站点来说,session的后台存储都是同一个redis,所以即使web站点被调度到任何一个节点,读取的session数据还是不变的。
不知道面试官问的是不是不同主域共享session,如果是这种情况是不能用这种方案的。
sessionid之类的客户端标志,做一致性哈希,保证每次访问到同一台机器,对n个客户端来说,祈祷分流作用,这样行不行.
要琢磨考官问的什么,然后给出"正确"答案,真挺难的
的确,redis,memcache是不二的选择,原因是他们是内存数据库,硬盘数据库的瓶颈就是硬盘Io。两者之间我比较推荐redis,因为它支持的数据格式多,而且扩展强大,比如持久化。
用memcached。
session不是持久化存储,跟rdbs的差异还是挺大的,但跟memcached很像。
至于sessionid,可以用应用里的uid来代替,需要手动管理。
memcache 是最佳选择 用memcache实现session的功能。
redis可以存储啊。